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(54) TiUe: NOVEL SELECTION METHOD 



^ (54) Bezelchnung: NEUE SELEKTIONSVERFAHREN 



(57) Abstract: The invention relates to methods for producing transformed plant cells or organisms by transforming a population 
of plant cells comprising at least one marker protein having a directly or indirectly toxic e£fect therefor, by means of at least one 
nucleic acid sequence to be inserted, said sequence being combined with at least one compound preferably a DNA construct which 
is able to reduce the expression, quantity, activity and/or function of the marker protein. The transfoimed plant cells have a growth 
advantage in relation to the non-transformed cells as a result of the action of said compound. 
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(57) Zusanunenfassung: Die vorliegende Erfindung betrifft Verfahren zur Herstellung trans forraierter pflanzlicher Zellen oder Or- 
ganism en durch Transformation einer Population pflanzlicher 2^11en, die mindestens ein Markerprotein mit einem fiir diese direkt 
Oder indirekt toxischen Effekl umfasst, mit mindestens einer zu insertierenden Nukleinsauresequenz in Kombination mit mindes- 
tens einer Verbindung - bevoizugt einem DNA-Konstrukl - befahigt zur Verminderung der Expression, Menge, Aktivitat und/oder 
Funktion des Markcrproteins, wobci die transformicrten pflanzlichcn Zellen infolge der ^ikung bcsagter Verbindung gegenUber 
nicht-transformierten Zellen einen Wachstumsvorteil haben. 
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Neue Selektionsverfahren 
Beschreibung 

5 

Die vorliegende Erfindung betrif ft Verfahren zur Herstellung 
trans formierter pflanzlicher Zellen oder Organismen durch Trans- 
formation einer Population pflanzlicher Zellen, die mindestens 
ein Markerprotein mit einem far diese direkt oder indirekt 

10 toxischen Bffekt umfasst, mit mindestens einer zu insertierenden 
Nukleinsanresequenz in Kombination mit mindestens einer Ver- 
bindung - bevorzugt einem DNA-Konstrukt - befahigt zur Ver- 
minderung der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins , wobei die trans formier ten pflanzlichen Zellen 

15 infolge der Wirkung besagter Verbindung gegenuber nicht-trans- 
formierten Zellen einen Wachs turns vorteil haben. 

Die EinfObrung genetischen Materials in Zielzellen gelingt meist 
• nur in einer sehr begrenzten Anzahl von Zellen einer Population. 

20 Dies macht die Unterscheidung und Isolierung von erfolgreich 
transformierten von nicbt- trans formier ten Zellen erf orderlich, 
ein Verfahren das als Selektion bezeichnet wird. Traditionell 
erfolgt die Selektion mittels einer sogenannten positiven 
Selektion, wobei die trans formierte Zelle in die Lage versetzt 

25 wird, zu wachsen iind zu tiberleben, wohingegen die untrans- 
formierte Zelle im Wachstum gehemmt oder abgetStet wird 
(Mccormick et al. (1986) Plant Cell Reports 5:81-84). Ublicher- 
weise wird eine derartige positive Selektion durch Gene reali- 
siert, die fiir eine Resistenz gegen ein Biozid kodieren (z.B. 

30 ein Herbizid wie Phosphinothricin, Glyphosat oder Bromoxynil, 
einen Metabolismusinhibitor wie 2-Desoxyglucose-6-phosphat 
(WO 98/45456) oder ein Antibiotikum wie Tetracyclin, ftmpicillin, 
Kanamycin, G 418, Neomycin, Bleomycin oder Hygromycin) . Derartige 
Gene werden auch als positive Selektionsmarker bezeichnet. Der 

35 positive Selektionsmarker wird gekoppelt (physikalisch oder 

mittels Cotrans formation) mit der in das Zellgenom einzufuhrenden 
Nukleinsaiiresequenz in die Zelle eingebracht. AnschlieSend werden 
die Zellen auf einem Medium iinter dem entsprechenden Selektions- 
druck (z.B. in Gegenwart eines entsprechenden Antibiotikums oder 

40 Herbizids) kultiviert, wodurch die transformierten Zellen auf- 
grund der erworbenen Resistenz gegen besagten Selektionsdruck 
einen Wachstims-ZUberlebensvorteil haben und so selektioniert 
werden konnen. Beispielhaft als positive Selektionsmarker seien 
genannt : 

45 
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Phosphinothxicinacetyl trans ferasen (PAT) (auch Bialophos®- 
Resistenz; bar) acetylieren die freie Aminogruppe des 
Glutaminsynthaseinhibitors Phosphinothricin (PPT) und 
erreichen damit eine Detoxif izierung (de Block et al. (1987) 
5 EMBO J 6:2513-2518; Vickers JE et al . (1996) Plant Mol Biol 

Reporter 14:363-368; Thonqpson CJ et al. (1987) EMBO J 
6:2519-2523) . 

5-Enolpyruvylshikimat-3-phosphatsynthasen (EPSPS) verleihen 

10 eine Resistenz gegen das xinselektive Herbizid Glyphosat® 

(N- (Phosphonomethyl) glycin; Steinrucken HC et al. (1980) 
Biochem Biophys Res Commiin 94:1207-1212; Levin JG und Sprin- 
son DB (1964) J Biol Chem 239:1142-1150; Cole DJ (1985) Mode 
of action of glyphosate; A literature analysis, p. 48-74. In: 

15 Grossbard E und Atkinson D (eds.) The herbicide glyphosate. 

Buttersworths, Boston.). Glyphosat-tolerante EPSPS Varianten 
zur Verwendung als Selektionsmarker sind beschrieben (Pad- 
gette SR et al. (1996). New weed control opportunities: deve- 
lopment of soybeans with a Ro\indup Ready™ gene. In: Herbicide 

20 Resistant Crops (Duke SO, ed. ) , pp. 53-84. CRC Press, Boca 

Raton, FL; Saroha MK und Malik VS (1998) J Plant Biochemistry 
and Biotechnology 7:65-72; Padgette SR et al. (1995) Crop 
Science 35 (5) : 1451-1461; US 5,510,471; US 5,776,760; 
US 5,864,425; US 5,633,435; US 5,627;061; US 5,463,175; 

25 EP-A 0 218 571) . 

Neomycinphosphotransf erasen verleihen eine Resistenz gegen 
T^minoglykosid-Antibiotika wie Neomycin, G418, Hygromycin, 
Paromomycin oder Kanamycin, indem sie durch eine Phosphory- 
30 lier\ingsreaktion deren inhibierende Wirkung reduzieren (Beck 

et al. (1982) Gene 19:327-336). 

2-Desoxyglukose-6-phosphatphosphatasen verleihen eine 
Resistenz gegen 2-Desoxyglukose (EP-A 0 807 836; Randez-Gil 
35 et al. (1995) Yeast 11:1233-1240; Sanz et al . (1994) Yeast 

10:1195-1202) . 

Acetolactatsynthasen verleihen eine Resistenz gegen 
Imidazolinon/Sulf onylharnstof f-Herbizide (z.B, Imazzamox, 
40 Imazapyr, Imazaquin, Imazethapyr, Amidosulf oron, Azim- 

sulfuron, Chlorimuronethyl, Chi or sulfur on; Sathasivem K 
et al. (1990) Nucleic Acids Res 18(8):2188). 

Dariiber hinaus sind Resistenzgene gegen die Antibiotika Hygro- 
45 mycin (Hygroiaycinphosphotransf erasen) , Chloramphenicol (Chloram- 
phenicolacetyl transferase) , Tetracyclin, Streptomycin, Zeocin xind 
Ampicillin (E-Lactamase Gen; Datta N, Richmond MH. (1966) Biochem 



10 



15 
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J 98 (1) :204-'9) beschrieben. 

Gene wie die I sopentenyl transferase (ipt) aus Agrobacteriuin tume- 
faciens {strain:P022) (Genbank Acc .-No . : AB025109) konnen eben- 
falls als Selektionsmarker eingesetzt warden. Das ipt Gen ist 
ein Schliisselenzym der Cytokin-Biosynthese. Seine tiberexpression 
erleictitert die Regeneration von Pflanzen (z.B. Selektion auf 
Cytokin-freiem Medium) (Ebinuma H et al. (2000) Proc Natl Acad 
Sci USA 94:2117-2121; Sbimma H et al. (2000) Selection of 
Marker-free transgenic plants using the oncogenes (Ipt, rol A, B, 
C) of Agrobacterium as selectable markers. In Molecular Biology 
of Woody Plants. Kluwer Academic Publishers). Nachteilig ist hier 
zum einen, dass der Selektionsvorteil auf meist siibtilen Unter- 
schieden in der Zellprolif eration beniht, zum anderen die Pflanze 
durch die Transformation mit einem Onkogen unervninschte Eigen- 
schaften (Galltumorbildung) erhait. • 

Verschiedene weitere positive Selektionsmarker sind in 
EP-A 0 601 092 beschrieben. Beispielhaft sind zu nennen: 
p-Clucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Mannose-6-phosphat-Isomerase (in Verbindung mit Mannose) , UDP- 
Galaktose-4-Epimerase (in Verbindung mit z.B, Galactose). 

Negative Selektionsmarker werden zur Selektion von Organismen mit 
erfolgreich deletierten Marker sequenzen eingesetzt (Koprek T et 
al. (1999) Plant J 19 (6) : 719-726) • In Gegenwart eines negativen 
Selektionsmarkers wird die entsprechende Zelle abgetotet oder er- 
fahrt einen Wachstumsnachteil . Bei der negativen Selektion wird 
beispielsweise durch den in die Pflanze eingebrachten negativen 
Selektionsmarker eine Verbindung, die ansonsten fur die Pflanze 
keine nachteilige Wirkung hat, in eine Verbindung mit nach- 
teiliger (d.h. toxischer) Wirkung umgesetzt. Beispiele fur nega- 
tive Selektionsmarker umfassen: Thymidinkinase (TK) z.B- des Her- 
pes Simplex Virus (Wigler et al. (1977) Cell 11:223), zellulSre 
Adeninphosphoribosyl transferase (APRT) (Wigler et al. (1979) Proc 
3^ Natl Acad Sci USA 76:1373), Hypoxanthinphosphoribosyltransf erase 
(HPRT) (Jolly et al . (1983) Proc Natl Acad Sci USA 80:477), 
Diphtheria Toxin A Fragment (OT-A) , die bakterielle Xanthin- 
Guaninphosphoribosyl transferase (gpt; Besnard et al. (1987) Mol. 
Cell. Biol. 7:4139; Mzoz and Moolten (1993) Human Gene Therapy 
4:589-595)/ das codA Genprodukt kodierend fvir eine Cytosinde- 
aminase (Gleave AP et al. (1999) Plant Mol Biol. 40 (2) :223-35 ; 
Perera RJ et al . (1993) Plant Mol Biol 23(4): 793-799; Stougaard 
J; (1993) Plant J 3:755-761; EP-Al 595 873), das Cytochrom P450 
Gen (Koprek et al. (1999) Plant J 16:719-726), Gene kodierend fur 
eine Haloalkandehalogenase (Naested H (1999) Plant J 18:571-576), 
das iaaH Gen (Sundaresan V et al. (1995) Genes & Development 
9:1797-1810) oder das tms2 Gen (Fedoroff NV & Smith DL (1993) 
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Plant J 3: 273-289). Die negativen Selektionsmarker werden meist 
in Kombination mit sogenannten ^Prodrugs" Oder '^Pro-Toxinen" 
eingesetzt, Verbindungen die durch die Aktivitat des Selektions- 
markers in Toxine iimgesetzt werden. 

5 

5-Methylthioribose-(MTR) -kinase ist ein Enzym, dessen enzymati- 
sche Aktivitat nicht in SSugem, wohl aber in Pflanzen, Bakterien 
\ind Protozoen beschrieben ist. Das Enzym kann ein MTR-Analog 
(5-(Trifluoromethyl) thioribose) als sogenanntes '^subversives 
10 Substrat" des Methionin-Ausweich-Stof fwechselwegs ( ''Salvage Path- 
way") liber ein instabiles Intermediat zu der toxischen Verbindung 
Carbothionyldif luorid umsetzen. 

Besagte Selektionssysteme haben verschiedene Nachteile. Der 

15 eingebrachte Selektionsmarker (z.B. Antibiotikaresistenz) 

hat seine Berechtigung allein wahrend der Transformation und 
Selektion stellt jedoch spater ein in der Kegel \inn6tiges und 
oft auch iinerwunschtes Proteinprodukt dar. Dies kann aus Grtinden 
der Verbraucherakzeptanz und/oder der Zulassung als Lebens- 

20 und/oder Futtermittel unvorteilhaf t sein. Nachteilig ist in 
diesem Zusammenhang ferner, dass der zur Selektion verwendete 
Selektionsmarker in der Kegel genetisch mit der in das Genom zu 
insertierenden Nukleinsaureseciuenz gekoppelt ist und nicht durch 
Segregation im Rahmen der Vermehrung oder Kreuzung entkoppelt 

25 werden kann. In der Kegel ist eine Deletion der Markersequenz 

erforderlich, was zusatzliche Arbeitsschritte erfordert. Dariiber- 
hinaus erfordern biotechnologische Arbeiten in zahlreichen Fallen 
eine Mehrf achtramsf oirmation mit verschiedenen Genkonstrukten. 
Hier ist ftlr jeden Trans formations schritt ein neuer Selektions- 

30 marker erf orderlich, wenn nicht der zuvor veiHArendete zunachst 
muhsam deletiert werden soil. Dies erfordert jedoch eine breite 
Palette gut funktionierender Selektionsmarker, die fiir die 
meisten pf Isinzlichen Organismen nicht zur Verfiigung stehen. 

35 Es stellte sich folglich die Aufgabe, neue Selektionsverf ahren 
zur Selektions transf ormierter pflanzlicher Zellen und Organismen 
bereitzustellen, die maglichst die Nachteile der vorhandenen 
Systeme nicht mehr aufweisen. Diese Aufgabe wird durch die vor- 
liegende Erfindiong gelost. 

40 

Ein erster Gegenstand der Erfindung betrif ft ein Verfahren zur 
Herstellung transf ormierter pflanzlicher Zellen oder Organismen 
-umfassend nachfolgende Schritte: 

45 a) Transformation einer Population pflanzlicher Zellen, wobei 
die Zellen besagter Population mindestens ein Markerprotein 
enthalten, das fiir besagte Population direkt oder indirekt 
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einen toxischen Effekt bewirken kaxm. mxt mxndestens exner 
zu insertierenden Nukleinsauresequenz Kombxnatxon mxt 
mindestens einer Verbindung bef Shigt zur Vermnderung der 
^ression. Menge. Aktivitat und/oder Funktion mxndestens 
eines Markerproteins , iind 

Selektion von trans foooierten pflanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufwexsen und dxe 
inf olge der Wirkung besagter Verbindung ^^^^^^^ 
transf ormierten Zellen einen Wachstumsvortexl haben, aus 
bei^JterPopulation pflanzlicher Zellen. wobei die Selektxon 
StifBedLLxgen durchgefuhrt wird, bei denen das Marker- 
^oJLn sei^ toxischen Ef fekt auf die nicbt transf ormxert en 
Zellen ausuben kann. 

in einer bevorzugten Aus fiihrungs form ist das ^^^^^^^^^^^^ . ^ 
iin protein, dass in der Lage ist, eine filr besagte Populatxon 
pi^alzlIcL; zellen nicht-toxische Substanz X in eine fOr besagte 
fopSftion toxiscbe Substanz . direkt ^^z^, 
20 Das erf indungsgeraaSe Verfalnren uxaf asst xn dxesem Fall bevorzugt 
nachfolgende Schritte: 

a) Transformation der Population pflanzlicher Zellen mit 

mindestens einer zu insertierenden ^l^^^^-^^^Z'^^^^^^ 
25 Kombination mit mindestens einer Verbxndung bef Mhxgt zur 

verminderung der Expression, Menge. Aktivit^t und/oder 
Funktion mindestens eines Markerproteins , und 

Behandlung besagter Population pflanzlicher Zellen mit der 
ItTlTl in eLer Konzentration, die infolge der ^^etzung 
durch das Markerprotein einen fiir nicht-transf ormxerte Zellen 
toxischen Effekt bedingt, und 

selektion von transf ormierten pflanzlichen Zellen, d±^ in 

iSL Genom besagte insertierte -'^l--t"^r''^'::e:Ser 
und die infolge der Wirkung besagter Verbxndung gegenOber 
nicht-transfoxmierten Zellen einen Wachstumsvortexl auf- 
wiisen, aus besagter Population pflanzlicher Zellen wobex 
Si selektion unter Bedingungen durchgeftihrt wird, bex denen 
40 das Markerprotein seinen toxischen Effekt auf dxe nxcht 

transf ormierten Zellen ausiiben kann.. 

Bevorzugt handelt es sich bei der nicht-toxischen Substanz X urn 
elle slSstanz, die natOrlicherweise in pflanzlichen Zellen oder 
AS oraanismen nicht oder nur in Konzentration vorkommt, dxe xm 

°e!^tlTchen keinen toxischen Effekt bewirken konnen Bevorzugt 
wird Se nicht-toxische Substanz X im Rahmen des erfxndungs- 



b) 

30 



c) 

35 



V 
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gemaiSen Verfahrens exogen z,B. tiber das Medixm oder das wachs- 
tumssxibstrat appliziert. 

Der Begrif f ^^Verbindiing befahigt zur Verminderung der Expression, 
5 Menge, Aktivitat und/oder Funktion mindestens eines Marker- 
proteins' ist breit zu verstehen iind meint allgemein alle Ver-- 
bindiingen, die direkt oder indirekt, alleine oder in Kooperation 
mit anderen Faktoren eine Verminderung der Proteinmenge, RNA- 
Menge, Genaktivitat , Proteinaktivitat - oder funktion mindestens 

10 eines Markerproteins bewirken. Besagte Verbindxmgen sind infolge 
auch unter der Bezeichnung ^anti-Markerprotein^-Verbindiingen 
zusammengefasst. Der Begrif f anti-Mar kerprotein^-Verbindung 
schlieiSt insbesondere - jedoch nicht einschrSnkend - die im 
Rahmen des erf indiingsgemaSen Verfahren in den bevorzugten Aus- 

15 fOhriingsformen z\am Einsatz kommenden Nukleinsauresequenzen, 
RibonukleinsSuresequenzen, doppelstrangigen Ribonukleinsaure- 
sequenzen, antisense-RibonukeinsSuresequenzen, Expressions- 
kassetten. Peptide, Proteine oder andere Faktoren ein. 

20 In einer bevorzugten Ausfuhrungsf orm meint ^anti-Markerprotein"- 
Verbindiing ein DNA-Konstrukt uutifassend 

a) mindestens eine Expressionskassette geeignet zur Expression 
einer Ribonukleinsauresequenz und/oder - gegebenenf alls - 

25 eines Proteins, wobei besagte NukleinsSuresequenz und/oder 

Protein in der Lage ist, die Esqpression, Menge, Aktivitat 
und/oder Funktion des Markerproteins zu vermindem, oder 

b) mindestens eine Sequenz, die eine teilweise oder voll- 

30 standige Deletion oder Inversion der Sequenz kodierend fiir 

besagtes Markerprotein bewirkt und so eine Verminderung 
der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins ermSglicht, sowie - gegebenenf alls - weitere 
Frinktionselemente, die besagte Deletion oder Inversion 

35 erleichtem und/oder fordem, oder 

c) mindestens eine Sequenz, die eine Insertion in die Sequenz 
kodierend fiir das besagte Markerprotein bewirkt und so eine 
Verminderung der Expression, Menge, Aktivitat und/oder 

40 Funktion des Markerproteins ermoglicht, sowie - gegebenen- 

falls - weitere Funktionselemente, die besagte Insertion 
erleichtem und/oder f6rdem. 

Das erf indungsgemafie Verfabren hebt die negativ-selektive 
45 Wirkung des Markerproteins auf . Insofem wirkt eine *anti- 

Markerprotein^-Verbindimgen direkt (z.B. liber die Inaktivierung 
mittels Insertion in das Gen kodierend fiir das Markerprotein) 
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Oder indirekt (z.B. mittels del durch die f^-^^^^^^^^^^^ 

des Markerproteins "revertiert" . 

Das erfindungsgemaSe Verfahren bedeutet eine sprxmghaf te Ver- 
breiteLg dL Kepertoirs an positiven Selektionsverf ahren zur 
10 Selektion trans formierter pflanzlicher Zellen. 

Vorteilhaft ist femer. dass in besti^ten, bevorzugten Aus- 
fS^gsforxa (z.B. durch Wirkung einer ^-^^^^^'^^^^iZ^fH^, 
f^tisense RNA) der Selektionsef f ekt ohne Expressxon exnes Fremd 
15 proteins realisiert werden kann (s.u.). 

vorteilhaft ist darxiber hinaus, dass das zur Selektion indirekt 
vorteilhaft ist aa negative Selektionsmarker ) 

verwendete Markerprotein (z.B. aer negativ Ni,viein- 
^cbt genetisch mit der in das Genom zu insertierenden Nuklein 
nicnc geneui -.^ 2^^. tti, Unterschied zu den ansonsten 

20 sauresequenz gekoppelt ist. Im Unterscniea 

iiblichen selektionsverfahren kann das Markerprotein " --^^^ 
Teh ^ ein Transgen handelt - durch einf ache Segregation im 
Rahxaen nachfolgender Vermehrung oder Kreuzung entfemt werden. 

25 "Pflanzliche Zelle" meint im Rahmen der vorliegenden Brfindung 
jegit^hi St von Zelle, die von einem pflanzlichen Organis^us 
aSeleitet oder in diesem vorhanden ist. Der Begriff umfasst 
SjfiTeispielbaft ProtopXasten, ^^^^ ™. 
Mikrosporen. Pollen, Zellen in Form von Geweben wie slattern 
30 ^StL, slaten, Er^ryonen, Wurzeln usw. ^-^--<^-!^^^^^^^J^" 
solche zellen und Zellpopulationen umfasst, die sich als Ziel 
geweben fiir eine Transformation eignen. 

^Pflanzlicher Organismus" umfasst dabei jeden ^^^^^^^^^ , 
35 zur Photosynthese befahigt ist, sowie die von diesem ^f--^^^^ 
zellen, Gewebe, Teile oder Vermehrungsgut ^--\^^^J^l^ 
Frachte) . Eingeschlossen sind im Rahmen der Erfindung alle 
Stungen und Arten h6herer und niedrigerer ^^1---^- 
Pflanzenreiches. Einjahrige, mehrj^hrige, 
40 dicotyledone Pflanzen sowie Gymnospermen sind bevorzugt. 

"Pflanze- im Rahmen der Erfindung meint alle Gattungen und 
^ten haherer und niedrigerer Pflanzen des ^^^^^^^^^^^^ " 
Eingeschlossen unter dem Begriff sind die ^-^^^^^^^J^^ 
45 gut, Sprossen und Keimlinge, sowie davon ^^^^^^^ J^^^J: J^^^. 
^h^ungsgut (zum Beispiel Knollen, Samen oder Fruchte) . Pflanzen 
Swebe, Protoplasten. Kallus und andere Kulturen, zum 
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Beispiel Zellkulturen, sowie alle anderen Arten von Gruppierungen 
von Pflanzenzellen zu funktionellen oder strukturellen Einheiten. 
Reife Pflanzen itieint Pflanzen zu jedem beliebigen Entwicklungs- 
stadium jenseits des Keimlings. Keimling meint eine junge, 
5 unreife Pflanze in einem friihen En twicklungs stadium. ^^Pflanze" 
umfasst alle einjahrigen und mehrjahrige, monokotyledonen und 
dikotyledonen Pflanzen und schlielSt beispielhaft jedoch nicht 
einschrSnkend solche der Gattungen Cucurbita, Rosa, Vitis, 
Juglans, Fragaria, Lotus, Medicago, Onobrychis, Trifolium, 

10 Trigonella, Vigna, Citrus, Linum, Geranium, Manihot, Daucus, 
Arabidopsis, Brassica, Raphanus, Sinapis, Atropa, Capsicum, 
Datura, Hyoscyamus, Lycopersicon, Nicotiana, Solarium, Pet\inia, 
Digitalis, Majorana, Cichorium, Helianthus, Lactuca, Bromus, 
Asparagus, Antirrhinum, Heterocallis, Nemesis, Pelargonium, 

15 Panieum, Pennisetum, Raniinculus, Senecio, Salpiglossis , Cucumis, 
Browaalia, Glycine, Pisum, Pbaseolus, Lolixjm, Oryza, Zea, Avena, 
Hordeum, Secale, Triticum, Sorghim, Picea und Populus ein, 

Bevorzugt sind Pflanzen nachf olgender Pf lanzenf amilien: Amaranth- 
20 aceae, Asteraceae, Brassicaceae, Carophyllaceae, Chenopodiaceae , 
Compositae, Cruciferae, Cucurbitaceae, Labiatae, Leguminosae, 
Papilionoideae, Liliaceae, Linaceae, Malvaceae, Rosaceae, 
Rubiaceae, Saxif ragaceae , Scrophulariaceae, Solanacea, 
Sterculiaceae , Tetragoniacea , Theaceae , Umbellif erae . 

25 

Bevorzugte monokotyle Pflanzen sind insbesondere ausgewahlt aus 
den monokotylen Kulturpf lanzen, wie zvim Beispiel der Familie der 
Gramineae wie Alfalfa, Reis, Mais, Weizen oder andere Getreide- 
arten wie Gerste, Hirse, Roggen, Triticale oder Hafer sowie dem 
30 Zuckerrolir sowie alien Arten von Grasem. 

Bevorzugte dikotyle Pflanzen sind insbesondere ausgewahlt aus den 
dikotylen Kulturpf lanzen, wie zxam Beispiel 

35 - Asteraceae wie Sonnenblume, Tagetes oder Calendula und andere 
mehr , 

- Compositae, besonders die Gattung Lactuca, gcinz besonders die 
Art sativa (Salat) und andere mehr, 

40 

- Cruciferae, besonders die Gattxing Brassica, ganz besonders 
die Arten napus (Raps), campestris (Riibe) , oleracea cv Tastie 
(Kohl), oleracea cv Snowball y (Bliomenkohl) \ind oleracea cv 
Emperor (Broccoli) und weitere Kohlarten; und der Gattung 

45 Arabidopsis, ganz besonders die Art thaliana sowie Kresse 
Oder Canola und andere mehr. 
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Cucurbitaceae wie Melone,. Kiirbis oder Zucchini tmd andere mehr, 

Legmainosae besonders die Gattung Glycine, ganz besonders die 
Art max (Sojabohne) sowie Alfalfa, Erbse. Bohnengewachsen oder 
Erdnuss und andere mehr 

Rubiaceae, bevorzugt der Unterklasse Lamiidae wie beispiels- 
weise Coffea arabica oder Coffea liberica (Kaf f estrauch) und 
andere mehr, 

- Solanaceae besonders die Gattung Lycopersicon, ganz besonders 
die Art esculentum (Tomate) , die Gattung Solanum, ganz beson- 
ders die Art tuberosum (Kartoffel) und melongena (Aubergxne) 
und die Gattung Capsicum, ganz besonders die Art annum (Pfef- 

15 fer) sowie Tabak und andere mehr, 

- sterculiaceae, bevorzugt der Unterklasse Dilleniidae wie bei- 
spielsweise Theobroma cacao (Kakaostrauch) und andere mehr, 

Theaceae, bevorzugt der Unterklasse Dilleniidae wie ^eispiels- 
weise camellia sinensis oder Thea sinensis (Teestrauch) und 
andere mehr, 

- umbelliferae, besonders die Gattung Daucus (ganz besonders 
die Art carota (Karrotte) ) und Apium (ganz besonders die Art 
graveolens dulce { Seller ie ) ) und andere mehr; 



20 - 



25 



sowie Lein, Bamnwolle, Hanf, Flachs, Gurke, Spinat, M5hre, 
Zuckerriibe und den verschiedenen Baum-, Nuss- und Weinarten, 
30 insbesondere Banane und Kiwi. 

Pf lanzliche Organismen im Sinne der Erfindung sind weiterhin 
weitere photosynthetisch aktive befahigte Organismen, wie zum 
Beispiel Algen, Cyanobakterien sowie Moose. Bevorzugte Algen sind 
35 Grtinalgen, wie beispielsweise Algen der Gattung Haematococcus , 
Phaedactylum tricomatum, Volvox oder Dunaliella. Insbesondere 
bevorzugt ist Synechocystis . 

Besonders bevorzugt ist die Gruppe der Pf lanzen bestehend aus 
40 Weizen. Hafer, Hirse, Gerste. Roggen, Mais, Reis, Buchweizen 

sorghum, Triticale, Dinkel, Leinsamen, Zuckerrohr, Raps Kresse, 
Ar^idopsis, Kohlarten, Soja, Alfalfa, Erbse, Bohnengewachsen, 
Erdnuss, Kartoffel, Tabak, Tomate, Aubergine, P^prika Sonnen- 
blume, Tagetes, Salat, Calendula, Melone, Kflrbis und Zucchini. 

45 
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Am meisten bevorzugt sind 

a) Pflanzen, die zur Olproduktion geeignet sind, wie beispiels- 
weise Raps, Sonnenblume , Sesaiti, Farberdistel (Carthamus 

5 tinctorius) , Olbaum, Soja, Mais, Erdnuss, Rizinus, Olpalme, 

Weizen, Kakaostrauch oder verschiedene Nussarten wie bei- 
spielsweise Walnuss, Kokosnuss oder Mandel. Unter diesen 
wieder besonders bevorzugt sind dikotyledonen Pflanzen, ins- 
besondere Raps, Soja und Sonnenblume . 

10 

b) Pflanzen, die der Starkeproduktion dienen, wie beispielsweise 
Mais, Weizen oder Kartoffel. 

c) Pflanzen, die als Nahrungs- und/oder Futtermittel und/oder 
15 Nutzpflanze genutzt werden und bei denen sine Resistenz gg. 

Pathogene vorteilhaft ware, wie beispielsweise Gerste, 
Roggen, Reis, Kartoffel, Bauinwolle, Flachs, Lein. 

d) Pflanzen, die zur Produktion von Feinchemikalien wie bei- 
20 spielsweise Vitaminen iind/oder Carotinoiden dienen k6nnen, 

wie beispielsweise Raps . 

"Population pflanzlicher Zellen" meint jegliche Gruppe von 
pflanzlichen Zellen die im Rahmen der vorliegenden Erfindung 

25 einer Transformation "unterworfen werden kann und von der nach dem 
erfindungsgemaSen Verfahren transf ormierte transgene pflanzliche 
Zellen erhalten und isoliert werden konnen. Besagte Population 
kann dabei beispielsweise auch ein pflanzliches Gewebe, Organ 
Oder eine Zellkultur usw. sein. Beispielhaft jedoch nicht ein- 

30 schrankend, kann besagte Population eine isolierte Zygote, ein 

isolierter unreifer Enibryo, embryogener Kallus, Pflanzlichen oder 
aucb verschiedene Blutengewebe (sowohl in vitro als auch in vivo) 
umfassen. 

35 '^Genom" meint die Gesamtheit der Erbinf ormation einer pflanz- 
lichen Zelle iind lamfasst sowohl die genetische Information des 
Zellkems als auch die der Plastiden (z.B. Chloroplasten) und 
Mitochondrien . Bevorzugt meint Genom jedoch die genetische 
Information des Zellkems (beispielsweise der nuklearen Chromo- 

40 somen) . 

"Selektion" meint das Identif izieren und/oder Isolieren von 
erfolgreich transf ormier en pflanzlichen Zellen aus einer Popu- 
lation nicht-transformierter Zellen unter Einsatz des erfindungs- 
45 gemaSen Verfahrens. Dabei ist es nicht zwingend erf orderlich, 
dass die Selektion unmittelbar nach der Transformation direkt 
mit den transf ormierten Zellen erfolgt. Es ist auch moglich, die 
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Selektion erst zu einem spateren Zeitpimkt, ja sogar bei einer 
spateren Generation der aus der Transformation resultierenden 
pflanzlichen Organismen (bzw. von diesen abgeleiteten Zellen, 
Geweben, Organen oder Vermehrungsgut ) vorzunetmen. So konnen 
beispielsweise Arabidopsispf lanzen direkt mit z.B. der Vakuum- 
infiltrationsmethode transformiert werden (Clough S & Bent A 
(1998) Plant J 16 { 6 ) : 735-43 ; Bechtold N et al . (1993) CR Acad 
Sci Paris 1144(2) :204-212) imd ergeben infolge transgene Samen, 
welche anschlieSend der Selektion ausgesetzt werden konnen. 



10 



15 



20 



Die Tatsache, dass die zu insertierende Nukleinsauresequenz «in 
Kombination mit" der «anti-Markerprotein''-Verbindnng (beispiels- 
weise einem DNA-Konstrukt) transformiert wird. ist breit zu ver- 
stehen und meint, dass mindestens eine zu insertierende Nuklein- 
sauresequenz und mindestens eine "anti-Markerprotein'-Verbindung 
miteinander funktionell gekoppelt sind, so dass das Vorliegen der 
«anti-Markerprotein--Verbindung in der pflanzlichen Zelle - und 
des damit verbundenen Selektionsvorteils - das parallels Vor- 
liegen der insertierten Nukleinsauresequenz als wabrscheinlich 
anzeigt. Die zu insertierende Nukleinsauresequenz und die «anti- 
Markerprotein'-Verbindung (z.B. ein DNA-Konstrukt) kSnnen dabei 
bevorzugt, jedoch nicht zwingend, Teil eines einzigen Nuklem- 
saurekonstruktes (z.B. eines Trans format ionskonstruktes oder 
Transformationsvektors) sein. also physikalisch-chemisch durch 
25 eine kovalente Bindung gekoppelt vorliegen. Sie kSnnen Dedoch 
auch getrennt, beispielsweise im Rahmen einer Co-Transformation, 
gemeinsam eingefOhrt werden und auch so ihre Funktion im Rahmen 
des erfindungsgemaSen Verfahrens wahmehmen. Im Falle, dass die 
"anti-Markerproteinverbindung- -Qber die Expression einer RNA 
30 (beispielsweise eine antisense-RNA oder doppelstrSngige RNA) 

wirkt Oder eine solche RNA darstellt, kann «in Kombination" auch 
solche Ausfiihrunsformen umfassen, bei der die besagte RNA und die 
von der in das Genom insertierten Nukleinsauresequenz exprimierte 
RNA einen RNA-Strang ausbilden. 
35 "Nicht toxische Substanz X" meint allgemein Substanzen, die im 
Vergleich zu ihrem Itosetzungsprodukt Y - unter ansonsten gleichen 
Bedingungen - eine verminderte, bevorzugt eine im wesentlichen 
fehlende biologische Aktivitat - bevorzugt Toxizitat - aufweisen. 
Dabei ist die Toxizitat der Substanz Y mindestens doppelt so hoch 
40 wie die der Substanz X, bevorzugt mindestens funffach so hoch, 
besonders bevorzugt mindestens zehnfach so hoch, ganz besonders 
bevorzugt mindestens zwanzigfach so hoch, am meistens bevorzugt 
mindestens einhundertf ach so hoch. "Gleiche Bedingungen" meint 
dabei, dass alle Bedingungen abgesehen von den unterschiedlichen 
45 Substlnzen X bzw. Y gleich gehalten werden. Es werden demnach 

gleiche molare Konzentrationen von X bzw. Y, bei gleichem Medium, 
Temperatxir, Organismenart und -dichte etc. eingesetzt. Die 
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Umwandliingen der Substanz X in die Substanz Y kann auf ver- 
schiedene Weise z.B. durch Hydrolyse, Deaiainierung, Verseif\mg, 
Dephosphorylierung, Phospliorylierung, Oxidation oder eine andere 
Art der Aktiviertmg, Metabolisierung oder Umsetzung realisiert 
5 werden. Beispielhaft - jedoch nicht einschrankend - kann die 
Siibstanz X die inaktive Vorstufe oder Derivat eines Pflanzen- 
wachstumsregulators oder Herbizids sein. 

^^Toxizitat" oder '"toxischer Effekt" meint einen messbaren, 
10 negativen Einfluss auf die Physiologie der Pflanze oder der 
pflanzlichen Zelle iind kann dabei Symptome wie beispielsweise 
- jedoch nicht einschrankend - ein vermindertes oder gestortes 
Wachstum, eine verminderte oder gestSrte Photosyntheserate, eine 
verminderte oder gestarte Zellteiliing, eine verminderte oder 
15 gestorte Regeneration einer vollst&idigen Pflanze aus Zellkultur 
oder Kallus usw. tunfassen. 

Die mittels des erf indimgsgemassen Verfahrens erfolgreich trans- 
fontiierten pflanzlichen Zellen weisen - anders ausgedruckt - 

20 gegeniiber den nicht-transf ormierten Zellen der gleichen Ausgangs- 
population einen Wachstumsvorteil oder Selektionsvorteil ixnter 
Einwirkung der Substanz ^'X* auf. Wachstums- oder Selektionsvor- 
teil ist dabei breit zu verstehen und meint beispielsweise die 
Tatsache, dass besagte trans formierte pflanzliche Zellen in der 

25 Lage sind, Sch5sslinge auszubilden \md/oder zu vollstSndigen 

Pflcoizen regenerierbar sind, wohingegen die nicht-transformierten 
Zellen dies nicht oder nur mit deutlicher Verzogerung realisieren 
konnen . 

30 Der Begriff des ^Markerproteins" ist breit zu verstehen und meint 
allgemein all solche Proteine, die befahigt sind, 

i) per se einen toxischen Effekt auf die Pflanze oder pflanz- 
liche Zelle auszuiiben, oder 

35 

ii) eine nicht toxische Substanz X in eine fiir die Pflanze oder 
pflanzliche Zelle toxische Substanz Y direkt oder indirekt 
umzusetzen . 

40 Dabei kann es sich bei dem Markerprotein ein pf lanzeneigenes , 
endogenes Gen oder aber auch um ein Transgen aus einem anderen 
Organismus handeln. Bevorzugt hat das Markerprotein selber keine 
essentielle Funktion fiir den das Markerprotein umfassenden 
Organismus. Ubt das Markerprotein per se einen toxischen Effekt 

45 aus, so wird es bevorzugt nicht konstitutiv sondem beispiels- 
weise unter einem induzierbaren Promoter exprimiert. 
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Bevorzugt setzt jedoch das Markerprotein eine nicht toxische 
Substanz X in eine ftlr die Pflanze oder pflanzliche Zelle 
toxische Substanz Y direkt oder indirekt um. Insbesondere 
bevorzugt sind als Markerprotein die sogenannten 'negativen 
5 Selektionsmarker- . wie sie beispielsweise im Rahmen von gezielten 
Deletionen aus dem Genom eingesetzt werden. 

Beispielhaft jedoch nicht einschrSnkend sind fttr Markerproteine 
zu nennen: 

^° (a) Cytosindeaminasen (CodA oder CDase) , wobei bevorzugt 

Substanzen wie 5-Fluorocytosin (5-FC) als nicht toxische 
Substanz X eingesetzt werden. Cytosindeaminasen katalysieren 
die Deaminierung von Cytosin zu Uracil (Kilstrup M et al. 
(1989) J Bacterid 171:2124-2127; Anderson L et al. (1989) 
" Arch Microbiol 152:115-118). Bakterien und Pilze, die CDase- 

Aktivitat aufweisen. konvertieren 5-FC zu dem toxischen Meta- 
boliten ("Y") 5-Fluorouracil (5-FU) {Polak A & Scholer HJ 
(1975) Chemotherapy (Basel) 21:113-130). 5-FC selbst ist von 
geringer Toxizitat (Bennett JE, in Goodman and Gilman: the 
Pharmacological Basis of Therapeutics. 8th ed. , eds. Gilman 
AG et al. (Pergamon Press, New York) pp. 1165-1181). 5-FU 
jedoch hat einen stark zytotoxischen Effekt da es infolge zu 
Fluor o-UTP (FUTP) und Fluoro-dUMP (FdUMP) metabolisiert wird 
und so die RNA- und DNA-Synthese inhibiert (Calabrisi P & 
Chabner BA in Goodman and Gilman: the Pharmacological Basis 
of Therapeutics. 8th ed. , eds. Gilman AG et al. (Pergamon 
Press, New York) pp. 1209-1263); Damon LE et al. (1989) 
Pharmac Ther 43:155-189). 

^° Zellen hoherer Pflanzen und saugerzellen haben keine signi- 

f ikante CDase-AktivitSt und k6imen 5-FC nicht deaminieren 
(Polak A et al. (1976) Chemotherapy 22:137-153; Koechlin BA 
et al. (1966) Biochemical Pharmacology 15:434-446). Insofem 
wird im Rahmen des erf indungsgemSSen Verfahrens die CDase als 
Transgen (z.B. in Form einer transgenen Expressionskassette) 
in pflanzliche Organismen eingebracht. Entsprechende trans- 
gene pflanzliche Zellen oder Organismen werden dann als 
Masterpflanzen als Ausgangsmaterial eingesetzt. Entsprechende 
CDase Sequenzen, transgene pflanzliche Organismen und die 
Durchftihrung negativer Selektionsverf ahren unter Einsatz 
von z.B. 5-FC als nicht toxische Substanz X sind dem Fach- 
mann bekannt (WO 93/01281; US 5,358,866; Gleave AP et al. 
(1999) Plant Mol Biol 40 (2) : 223-35 ; Perera RJ et al. (1993) 
Plant Mol Biol 23 (4) : 793-799 ; Stougaard J (1993) Plant J 
* 3:755-761); EP-Al 595 837; Mullen CA et al. (1992) Proc Natl 

Acad Sci USA 89(1): 33-37; Kobayashi T et al. (1995) Jpn J 



35 
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Genet 70 (3) : 409-422; Schlaman HRM & Hooykaas PFF (1997) Plant 
J 11:1377-1385; Xiaohui Wang H et al. (2001) Gene 272(1-2): 
249-255; Koprek T et al. (1999) Plant J 19 ( 6) : 719-726 ; Gleave 
AP et al. (1999) Plant Mol Biol 40 (2) : 223-235; Gallego ME 
(1999) Plant Mol Biol 39(l):83-93; Salomon S & Puchta H 
(1998) EMBO J 17(20) :6086-6095; Thykjaer T et al. (1997) 
Plant Mol Biol 35 (4) : 523-530; Serino G (1997) Plant J 
12(3) :697-701; Risseeuw E (1997) Plant J 11(4) :717-728; Blanc 
V et al, (1996) Biociiimie 78 ( 6 ): 511-517 ; Comeille S et al. 
(2001) Plant J 27:171-178), Cytosindeaminasen und die dafOr 
kodierenden Gene konnen aus einer Vielzahl von Organismen, 
bevorzugt Mikroorganismen, wie beispielsweise den Pilzen 
Cryptococcus neoformans, Candida albicans, Tomilopsis 
glabrata, Sporothrix schenckii, Aspergillus, Cladosporium 
land Phialophora (JE Bennett, Cliapter 50: Antifxingal Agents, 
in Goodman and Gilitian's the Pharmacological Basis of Thera- 
peutics 8th ed., A.G. Gilman, ed. , Pergamon Press, New York, 
1990) sowie den bakterien E.coli *und Salmonella typhimurium 
(Andersen L et al. (1989) Arch Microbiol 152:115-118) 
erhalten werden. 

Auf die im Rahmen der genannten Publikationen of fenbarten 
Seguenzen, Material ien iind Verfahren wird hiermit aus- 
dirticklich Bezug genommen, 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: S56903, sowie die in EP-Al 595 873 
beschriebenen modif izierten codA Sequenzen, die eine 
E3^ression in Eukaryoten erm5glichen. Bevorzugt sind dabei 
Nukleinsauresequenzen, die fiir Polypeptide gemaS SEQ ID NO: 2 
Oder - bevorzugt - 4 kodieren, insbesondere die Sequenzen 
gemalS SEQ ID NO: 1 oder - bevorzugt - 3. 

(b) Cytochrom P-450 Enzyme, insbesondere das bakterielle Cyto- 
chrom P-450 SUl Genprodukt (CYP105A1) aus Streptomyces 
griseolus (Stamm ATCC 11796), wobei bevorzugt Substanzen wie 
das Pro-Sulfonylharnstoffherbizid R7402 (2-Methylethyl-2-3- 
dihydro-N- [ ( 4 , 6-dimethoxypyrimidin-2-yl ) aminocarbonyl] -1 , 2- 
benzoisothiazol-7-sulfonamid-l,l-dioxid) als nicht toxische 
Substanz X eingesetzt werden. Entsprechende Sequenzen und die 
Dxirchfuhrung negativer Selektionsverf ahren vmter Einsatz von 
z.B. R7402 als nicht toxische Substanz X sind dem Fachmann 
bekannt (O'Keefe DP et al. (1994) Plant Physiol 105:473-482; 
Tissier AF et al. (1999) Plant Cell 11:1841-1852; Koprek T 
et al. (1999) Plant J 19 (6) :719'726; O'Keefe DP (1991) Bio- 
chemistry 30(2) : 447-55) . Auf die im Rahmen der genannten 
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Publikationen offenbarten Sequenzen, Materialien irnd Ver- 
fahren wird hiermit ausdriicklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
5 GenBank Acc.-No: M32238. Bevorzugt sind femer Nuklein- 

sauresequenzen, die fur das Polypeptid gemaS SEQ ID NO: 6 
kodieren, insbesondere die Sequenz gemSS SEQ ID NO: 5. 

(c) IndolessigsS-urehydrolasen wie beispielsweise das tms2 

10 Genprodxikt aus Agrobacterium tumefaciens, wobei bevorzugt 

Substanzen wie Auxinamidverbindungen oder Naphtbalacetamid 
(NAM) als nicht toxische Substanz X eingesetzt werden (wobei 
NAM zu NaphthalessigsSure, einer phytotoxischen Siibstanz, um- 
gesetzt wird) . Entsprechende Sequenzen und die Durchfubrung 

15 negativer Selektionsverf ahren unter Einsatz von z.B. NAM als 

nicht toxische Substanz X sind dem Fachmann bekamnt (Fedorof f 
NV & Smith DL (1993) Plant J 3:273-289; Upadhyaya NM et al, 
(2000) Plant Mol Biol Rep 18:227-223; Depicker AG et al . 
(1988) Plant Cell rep 104:1067-1071; Karlin-Neumannn GA 

20 et al. (1991) Plant Cell 3:573-582; Sundaresan V etal. (1995) 

Gene Develop 9:1797-1810; Cecchini E et al. (1998) Mutat 
Res 401(1-2) :199-206; Ziobko E et al . (2000) Nat Biotechnol 
18:442-445). Auf die im Rahmen der genannten Publikationen 
offenbarten Sequenzen, Materialien xmd Verf ahren wird hiermit 

25 ausdrticklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc.-No: NC_003308 (Protein_id=''NP_536128.1) , AE009419, 
AB016260 (Protein_id=''BAA87807.1) und NC002147. Bevorzugt 
30 sind ferner Nukleinsauresequenzen, die fiir Polypeptide gemaS 

SEQ ID NO: 8 oder 10 kodieren, insbesondere die Sequenzen 
gemafi SEQ ID NO: 7 oder 9. 

(d) Haloalkandehalogenasen (dhlA Genprodukt) z.B. aus Xantho- 
35 bacter autotropicus GJlO. Die Dehalogenase hydrolisiert 

Dihaloalkane wie 1, 2-Dichloroethan (DCE) zu halogenierten 
Alkoholen \ind anorganischen Haliden (Naested H et al . (1999) 
Plant J 18(5)571-576; Janssen DB et al . (1994) Annu Rev 
Microbiol 48: 163-191; Janssen DB (1989) J Bacterid 
40 171(12) : 6791-9) . Auf die im Rahmen der genannten Publi- 

kationen offenbarten Sequenzen, Materialien und Verf ahren 
wird hiermit ausdriicklich Bezug genommen. 
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Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: M26950. Bevorzugt sind femer Nuklein- 
sauresequenzen, die ftir das Polypeptid gemaS SEQ ID NO: 12 
kodieren, insbesondere die Sequenz gemaS SEQ ID NO: 11. 

5 

(e) Thymidinkinasen (TK) , insbesondere virale TKs aus Viren wie 

Herpes Simplex Virus, SV40, Cytomegalovirus, Varicella-zoster 
Virus, insbesondere die TK des Typ 1 Herpes Simplex Virus (TK 
HSV-1) , wobei bevorzugt Substanzen wie Acyclovir, Ganciclovir 

10 Oder 1, 2-Deoxy-2-f luoro-P-D-arabinofuranosil-5-iodouracil 

(FIAU) als nicht toxische Substanz X eingesetzt werden. 
Entsprechende Sequenzen und die Durchfuhrxing negativer 
Selektionsverfahren unter Einsatz von z.B. Acyclovir, 
Ganciclovir oder FIAU als nicht toxische Substanz X sind dem 

15 Fachmann bekannt (Czako M & Marton L (1994) Plant Physiol 

104:1067-1071; Wigler M et al. (1977) Cell 11 (1) : 223-232 
McKnight SL et al. (1980) Nucl Acids Res 8 (24) : 5949-5964 ; 
McKnight SL et al. (1980) Nucl Acids Res 8 (24) : 5931-5948 
Preston et al . (1981) J Virol 38 (2) : 593-605 ; Wagner et al. 

20 (1981) Proc Natl Acad Sci USA 78 (3 ): 1441-1445 ; St. Clair 

et al.(1987) Antimicrob Agents Chemother 31 (6) : 844-849) . 
Auf die im Rahmen der genannten Publikationen of fenbarten 
Sequenzen, Mater ialien und Verfahren wird hiermit aus- 
driicklich Bezug genommen. 

25 

Insbesondere bevorzugt sind Sequenzen entsprechend den 
GenBank Acc.-No: J02224, V00470 und V00467 . Bevorzugt sind 
ferner Nixkleinsauresequenzen, die fiir Polypeptide gemaS 
SEQ ID NO: 14 oder 16 kodieren, insbesondere die Sequenzen 
30 gemaS SEQ ID NO: 13 oder 15, 

( f ) Guaninphosphoribosyltransf erasen, Hypoxanthinphosphoribosyl- 
transferasen oder Xanthinguaninphosphoribosyltransf erasen, 
wobei bevorzugt Sxibstanzen wie 6-Thioxanthin oder Allopurinol 

35 als nicht toxische Substanz X eingesetzt werden. Bevorzugt 

sind Guaninphosphoribosyltransf erasen (gpt) z.B. aus E. Coli 
(Besnard et al. (1987) Mol Cell Biol 7:4139; Mzoz and Moolten 
(1993) Human Gene Therapy 4:589-595; Ono et al . (1997) H\im 
Gene Ther 8 (17) :2043-55) , Hypoxanthinphosphor ibosyl trans - 

40 f erasen (HPRT; Jolly et al . (1983) Proc Natl Acad Sci USA 

80:477; Fonwick ^The HGPRT System** , pp. 333-373, M. Gottes- 
man (ed.). Molecular Cell Genetics, John Wiley and Sons, 
New York, 1985), Xanthinguaninphosphoribosyltransf erasen 
z.B. aus Toxoplasma gondii (Knoll LJ et al. (1998) Mol Cell 

45 Biol 18(2) :807-814; Donald RG et al. (1996) J Biol Chem 

271(24) :14010-14019) . Auf die im Rahmen der genannten 
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Publikationen of feiibarten Sequenzen, Materialien tmd Ver- 
fahreix wird hiennit ausdrticklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den 
GenBank Acc.-No: U10247 {Toxoplasma gondii HXGPRT) , M13422 
(E. coli gpt) vind X00221 (B. coli gpt) . Bevorzugt sind 
femer Nukleinsaizresequenzen, die fur Polypeptide gemalS 
SEQ ID NO: 18, 20 oder 22 kodieren, insbesondere die 
Sequenzen gemaE SEQ ID NO: 17, 19 oder 21. 



10 



(g) Purinnukleosidphosphorylasen (PNP; DeoD Genprodukt) z.B. 

aus E. coli, wobei bevorzugt Svibstanzen wie 6-Methylpurin- 
deoxyribonuJcleosid als nicht toxische Substanz X eingesetzt 
werden. Entsprechende Sequenzen und die Durchfiihrung nega- 
15 tiver Selektionsverf ahren unter Einsatz von z.B. 6-Methyl- 

purindeoxyribonukleosid als nicht toxische Substanz X sind 
dem Fachmann bekannt (Sorscher EJ et al. (1994) Gene Therapy 
1:233-238) . Auf die im Rahmen der genannten Publikationen 
offenbarten Sequenzen, Materialien und Verfahren wird hiennit 
20 ausdrticklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: M60917. Bevorzugt sind femer Nuklein- 
sauresequenzen, die fiir das Polypeptid gemaS SEQ ID NO: 24 
25 kodieren, insbesondere die Sequenz gemSS SEQ ID NO: 23. 

h) Phosphonatmonoesterhydrolasen, welche inaktive Esterderivate 
des Herbizides Glyphosat (z.B. Glycerylglyphosat ) zu der 
aktiven Form des Herbizids umsetzen. Entsprechende Sequenzen 

30 und die Durchfuhrung negativer Selektionsverf ahren unter Ein- 

satz von z.B. Glycerylglyphosat sind dem Fachmann bekannt 
(US 5,254.801; Dotson SB et al. (1996) Plant J 10 (2) :383-392; 
Dotson SB et al. (1996) J Biol Chem 271(42): 25754-25761). 
Auf die im Rahmen der genannten Publikationen offenbarten 

35 Sequenzen, Materialien und Verfahren wird hiermit ansdrflck- 

lich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend der 
GenBank Acc.-No: U44B52. Bevorzugt sind femer Nuklein- 
40 sauresequenzen, die ftlr das Polypeptid gemaS SEQ ID NO: 26 

kodieren, insbesondere die Sequenz gemaS SEQ ID NO: 25. 

(i) Aux-1 und - bevorzugt - Aux-2 Genprodukte z.B. der Ti- 
Plasmide von Agrobacterium Stammen wie A.rhizogenes oder 
45 A.tumefaciens (Beclin C et al. (1993) Transgenics Res 
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2:4855); Gaudin V, Jouanin L. (1995) Plant Mol Biol. 
28(1) :123-36. 

Die Aktivitat der beiden Enzyme bedingt die Produktion von 
5 Indolacetamid (lAA) in der pflanzlichen Zelle. Aux-1 kodiert 

fur eine Indolacetamidsynthase (JAMS) iind setzt Tryptophan zu 
Indolacetamid vim (VanOnckelen et al. (1986) FEES Lett. 198: 
357-360) . A\ix-2 kodiert fiir das Enzym Indolacetamidhydrolase 
(lAMH) und setzt Indolacetamid, eine Substanz ohne Phyto- 

10 hormonaktivitat , zu dem aktiven Auxin Indolessigsaure um 

(Inze D et al. (1984) Mol Gen Genet 194:265-274; Tomashow 
et al. (1984) Proc Natl Acad Sci USA 81:5071-5075; Schroder 
et al. (1984) Eur J Biochem 138:387-391). Das Enzym lAMH kann 
femer einer Reihe von Indolamid-Substraten wie beispiels- 

15 weise Naphthalacetamid hydrolisieren, wobei let z teres in den 

Pflanzenwachstiimsregulator Naphthalessigsaure (NAA) umgesetzt 
wird. Die Verwendung des lAMH Gens als negativer Selektions- 
marker ist beispielsweise in US 5,180,873 beschrieben. 
Entsprechende Enzyme sind auch in A. rhizogenes, A. vitis 

20 (Canaday J et al . (1992) Mol Gen Genet 235:292-303) and 

Pseudomonas savastanoi (Yamada et al. (1985) Proc Natl 
Acad Sci USA 82:6522-6526) beschrieben. Der Einsatz als 
negativer Selektionsmarker zum Abtoten bestimmter Zell- 
gewebe (z.B. Pollen; US 5,426,041) oder transgener Pflanzen 

25 (US 5,180,873) ist beschrieben. Entsprechende Sequenzen und 

die Durchfiihrung negativer Selektionsverf ahren xinter Einsatz 
von z.B. Naphthalacetamid sind dem Fachmann bekannt (s.o.) . 
Auf die im Rahmen der genannten Publikationen offenbarten 
Seciuenzen, Materialien und Verf ahren wird hiermit aus- 

30 driicklich Bezug genommen. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc.-No: M61151, AF039169 und AB025110. Bevorzugt sind 
femer Nukleinsauresequenzen, die fur Polypeptide gemaS 
35 SEQ ID NO: 28, 30, 32, 34 oder 3 6 kodieren, insbesondere 

die Sequenzen gemaS SEQ ID NO: 27, 29, 31, 33 oder 35. 

(j) Adeninphosphoribosyltransferasen (APRT) , wobei bevorzugt 
Substanzen wie 4-Aminopyrazolopyrimidin als nicht toxische 

40 Substanz X eingesetzt werden. Entsprechende Sequenzen und die 

Durchftihrung negativer Selektionsverf ahren \inter Einsatz sind 
dem Fachmann bekannt (Wigler M et al. (1979) Proc Natl Acad 
Sci USA 76(3) : 1373-6; Taylor et al . '^The APRT System", pp., 
311-332, M. Gottesman (ed.). Molecular Cell Genetics, John 

45 Wiley and Sons, New York, 1985) . 
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ic) Methoxinindelxydrogenasen,"obei bevorzugt ^^^^^J^^^J^^^^ 
2-Aiaino-4-methoxy-butaxxsa..re (Methoxxnxn) als nxcht ^oxxs^e 
Substanz X eingasetzt werden, welches zu^ ^-^^^^^Z^^^t- 
vinylglycin uiagesetzt wird (Margraff R et al. (1980) Kxperx 



mentia 36: 846) . 



c^tibstanz X eingesetzt werden, welches zum toxischen 2-AituLno 
,0 4T2-rinL3-hyd.oxypropyl]-trans-3-butansaure (Bhizobxtoxxn 

uxagesetzt wird (Owens LD et al. (1973) Weed Science 



21:63-66) , 



nvi 5-Metbylthioribose (MTR) kinasen, wobei bevorzugt Substanzen 
15 wie 5-TTrifluoromethyl)thioribose (HH^-Analog , "subversxves 

si^strat") als nicht toxische Substanz X eingesetzt wxrd, 
iTZTLr ein instabiles Xnter^ediat zu ^er -xxschen 
Siibstanz (Y) Carbothionyldifluorid umgesetzt wird. Die 
^-iTrlsl Lt ein Schl^sselenzyxa das --^-™-^z^ 
.0 ^offwechselwegs ("Salvage Pathway"), ^f^jf^^^,^^ 

aktivitaten warden nicht in SSugem, wohl aber m Pflanzen, 
B^ierien und Protozoen beschrieben. Kinasen aus ver- 

sSIedinen Arten wurden aufgrwxd definierter Se<xuenzmotive 
identifiziert (Sekowska A et al. (2001) BMC Microbiol 1:15; 
http- //www.bioH.edcentral.com/1471-2180/1/15) . Entsprechende 
SeSenzen und die Durchftihrung negativer Selekticnsverf ahren 
^^J^Hinsatz von z.B. 5- (Trif luoromethyl) thioribose sind dem 
Tc^ann bekannt und leicht aus /.^^^^^^^^ 
bank (z.B. GenBank) erhaltlich <S«^°--^^^^f ; ^^J!"^^) 
30 Bl^ Microbiol 1:15; Cornell KA et al (1996) 317^285 290^. 

Auf die im Rahmen der genannten Publikationen offenbarten 
SeLenzen, Materialien und Verfahren wird hier^t ausdruck- 
lich Bezug genommen. 

35 Bine pflanzliche MTR-Kinase ist bislang jedoch nicht 

eindeutig identifiziert worden und wird ™ des 
erfindungsgemaSen Verfahrens bereitsgestellt (SEQ JO^^y 
S 40) Daruberhinaus werden Homologe aus anderen Pflanzen- 
a^en bUeitgestellt nM^lich aus Mais (SBQ ID NO: 59 bzw. 
60), Raps (SEQ ID NO: 61, 63 bzw. 62. 64), Reis (SEQ ID 
NO: 65 bzw. 66) sowie Soja (SEQ ID NO: 67 bzw. 68). 

Ein weiterer Gegenstand der Erfindung betrif ft ^^^f ^^' 
saurese<iaenzen kodieren ftir eine pflanzliche ^-Methylthio 
45 ribosekinase, dadurch gekennzeichnet , dass besagte 

saureseciuenz .indestens eine Sec^enz -^l^^^^-^ffSir 68 
der Gruppe bestehend aus SEQ ID NO: 60, 62, 64, 66 oder 68. 
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Bin weiterer Gegenstand der Erfindving betrif ft demnach 
Nukleinsauresecjuenzen kodieren fttr eine pflanzliche 5-Methyl- 
thioribosekinase, dadurch gekermzeichnet , dass besagte 
Nukleinsauresequenz mindestens eine Sequenz enthait ausge- 
wShlt aus der Gruppe bestehend aus SEQ ID NO: 59, 61, 63, 65 
Oder 67. Auch wenn besagte Sequenzen teilweise nxir Fragmente 
vollstandiger cDNAs darstellen, ist ihre L&nge dennoch mehr 
als ausreichend liia eine Verwend\mg iind Funktionalitat als 
antsense-RNA bzw. doppelstrMngige RNA zu gewahrleisten. Be- 
vorzugt wird als Markerprotein eine pflanzliche, endogene 
MTR-Kinase verwendet . Weitere endogene pflanzliche MTR- 
Kinasen konnen leicht mittels Durchmusterxing von Daten- 
oder Genbanken imter Verwendxmg konservierter, MTK-Kinase 
typischer Motive identif iziert werden. Besagte Motive konnen 
beispielsweise aus Fig. 9a-b abgeleitet werden. Solche Motive 
kdnnen beispielhaft jedoch nicht einschrankend folgende 
Sequenzen umfassen: 

E(V/I)GDGN(L/I)N(L/Y/F)V(F/Y) bevorzugt EVGOGISTLN (Y/F) V (F/Y) 

KQALPY(V/I)RC 

SWPMT (R/K) ERAYF 

PEVYHFDRT 

GMRY(I/L)EPPHI 

CRLTEQWFSDPY 

HGDIjH(S/T)GS 

Weitere geeignete Motive konnen unschwer aus FIg.9a-b abge- 
leitet werden. 

Insbesondere bevorzugt sind Sequenzen entsprechend den Gen- 
Bank Acc.-No: AF212863 Oder AC079674 (Protein_ID=AAG51775 . 1 ) . 
Bevorzugt sind femer Nukleinsauresequenzen, die fiir Poly- 
peptide gema& SEQ ID NO: 3 8 oder 40 kodieren, insbesondere 
die Sequenzen gemafi SEQ ID NO: 37 oder 39. 

n) Alkoholdehydrogenasen (Adh) insbesondere pflanzliche Adh-1 
genprodukte, wobei bevorzugt Substanzen wie Allylalkohol 
als nicht toxische Substanz X eingesetzt werden, welche 
so zu der toxischen Substanz (Y) Acrolein umgesetzt wird. 
Entsprechende Sequenzen und die Durchfiihrung negativer 
Selektionsverfahren unter Einsatz von z.B. Allylalkohol sind 
dem Fachmann bekannt und leicht aus entsprechenden Sequenz- 
datenbank (z.B. GenBank) erhaitlich (Wisman E et al. (1991) 
Mol Gen Genet 226 < 1-2 >: 120-8; Jacobs M et al. (1988) Biochem 
Genet 26 (1-2) : 105-22 ; Schwartz D. (1981) Environ Health 
Perspect 37:75-7). Auf die im Rahmen der genannten Publi^ 
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kationen offenbarten Secjuenzen, Materialien und Verfahren 
wird hiermit ausdrticklich Bezug genommen. 

insbesondere bevorzugt sind Sequenzen ^^^sprechend Gen- 
5 Bank Acc.-No: X77943, M12196. AF172282, X04049 Oder AF253472. 

Bevorzugt sind femer Nukleinsaxiresequenzen, die fur Poly 
peptide gemaE SEQ ID NO: 42, 44. 46 oder 48 ^^-^^^^f ' 
besondere die Sequenzen gemafi SEQ ID NO: 41. 43, 45 oder 47. 

10 (o) Weiterhin sind als negativer Selektionsmarker solche 

Seguenzen geeignet, die per se eine toxische Wirkung auf 
pflanzliche Zellen ausuben, wie beispielsweise Diptheriatoxin 
A Ribonukleasen wie Barnase sowie Ribosom-inhibierende 
pioteine wie Ricin. Dabei werden diese Proteine bevorzugt xn 

15 den pflanzlichen Zellen nicht konstitutiv, sondern xnduzier- 

bar exprimiert. Bevorzugt erfolgt die Induktxon chemxsch, 
wobei beispielsweise die unten erwShnten chemisch-xnduzxer- 
baren Promotoren verwendet werden konnen, um diese chemisch- 
induzierte Ej^ression zu gewahrleisten. 

"Verminderung- oder •venaindem" ist im Zusaitottenhang mit 
eineiti Markerprotein, bzw. seiner Menge, Expression, Aktivxtat 
und/oder Funktion weit auszulegen und umfasst die t^^^^^^^^ 
Oder ira wesentlichen vollstandige, auf unterschiedlxche zell- 
25 biologische Mechanismen beruhende Unterbindung oder Blockxerung 
der Funktionalitat eines Markerproteins in ^^^^^ P^i^^^t^''^^^^^ 
zelle, Pflanze oder einem davon abgeleiteten Teil, Gewebe, Organ, 
Zellen oder Samen. 

30 Eine Verminderung im Sinne der Erfindung umfasst auch eine _ 

mengenmasige Verringerung eines Markerproteins bis hxn ^^^^^^ 
ixa wesentlichen vollstSndigen Fehlen des Markerproteins (^^^ 
fehlende Nachweisbarkeit von Markerprotein-Aktivitat bzw Marker 
protein-Funktion oder fehlende immunologische Nachweisbarkeit 
35 des Markerproteins). Dabei wird die Expression ^^^^^^^.l^"^)^. 
Markerproteins (bzw. seiner Menge. Expression, Aktivitat und/oder 
Funktion) in einer Zelle oder einem Organismus bevorzugt um mehr 
als 50 %, besonders bevorzugt um mehr als 80 %, ganz besonders 
bevorzugt um mehr als 90%. am meisten bevorzugt um mehr als 
40 98 % vermindert. Insbesondere meint Verminderung auch das 
vollstandigen Fehlen des Markerproteins (bzw. seiner Menge. 
Expression. Aktivitat und/oder Funktion) . Dabei meint Aktivitat 
und/oder Funktion bevorzugt die Eigenschaft des "^f 
einen toxischen Effekt auf die pflanzliche Zelle oder den pflanz- 
45 lichen Organismus auszutiben bzw. die Fahigkeit die Substanz X 
in die Substanz Y umzusetzen. Bevorzugt wird als der durch 
das Markerprotein bewirkte toxische Effekt um mehr als 50 %. 
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besonders bevorzugt um mehr als 80 ganz besonders bevorzugt 
um mehr als 90%, am meisten bevorzugt um mehr als 98 % ver- 
mindert. Selbst verstandliche umfasst ^Verminderxing" im Rahmen 
des erf indungsgemaSen Verfahrens auch eine vollstandige, 100%ige 
5 Verminderiing Oder Beseitigung des Markeiproteins (bzw. seiner 
Menge, Expression, Aktivitat und/oder Funktion) (z.B. durch 
Deletion des Markerprotein-Gens aus dem Genom) . 

Erf indungsgemafi sind verschiedene Strategien zur Verminderung der 
10 Expression, Menge, Aktivitat und/oder Funktion des Markerproteins 
umfasst. Der Fachmann erkennt, dass eine Reihe verschiedener 
Methoden zur Verfugung stehen, \jm die Expression, Menge, Aktivi- 
tat und/oder Funktion eines Markerproteins in gewOnschter Weise 
zu beeinflussen. Beispielhaf t , jedoch nicht einschrSnkend, seien 
15 zu nennen: 

a) Einbringen mindestens einer doppelstrSngigen Markerprotein 
RibonukleinsSuresequenz (MP-dsRNA) oder einer deren 
Expression gewahrleistenden Expressionskassette oder 

20 Expressionskassetten. Umfasst sind solche Verfahren, 

bei denen die MP-dsRNA gegen ein Markerprotein-Gen (also 
genomische DNA-Sequenzen wie Promotorsec[uenzen) oder ein 
Markerprotein-Gentranskript (also mRNA-Sequenzen) gerichtet 
ist . 

25 

b) Einbringen mindestens einer Markerprotein antisense-Ribo- 
nukleinsauresequenz (MP-antisenseRNA) oder einer deren 
Expression gewahrleistenden Expressionskassette. Umfasst 
sind solche Verfahren, bei denen die MP-antisenseRNA gegen 

30 ein Markerprotein-Gen (also genomische DNA-Sequenzen) 

Oder ein Markerprotein-Gentranskript (also RNA-Sequenzen) 
gerichtet ist. Umfasst sind auch a-anomere Nukleinsaure- 
sequenz en. 

35 c) Einbringen mindestens einer MP-antisenseRNA kombiniert mit 
einem Ribozym oder einer deren Expression gewahrleistenden 
Expressionskassette 

d) Einbringen mindestens einer Markerprotein sense-Ribonuklein- 
40 sauresequenz (MP-senseRNA) zur Induktion einer Kosuppression 

Oder einer deren Expression gewahrleistenden Expressions- 
kassette 



45 



e) 
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Faktors gegen ein Markerprotein-Gen , -RNA oder -Protexn 
Oder einrdessen Expression gew^hrleistenden Expressxons- 

kassette 



f) 



Einbringen raindestens einer den Markerprotexn ^N^"^- 
bewirkenden viralen Nukleinsauresecjuenz oder exner deren 
Expression gewShrleistenden Expressionskassette 



10 g) Einbringen mindestens eines Konstruktes zur Erzeugung exnes 
^ Funktionsverlustes (z.B. Generierung von Stopp-Kodons Ver 
schiebungen ixa Leseraster etc . ) an einem " 
beispielsweise durch Erzeugung einer 1^^^^^^°^' 
inversion oder Mutation in einem Markerprotexn-Gen . Bevorzugt 
15 konnen Knockout-Mutanten laittels gezielter Insertion xn 

" S^gtes Markerprotein-Gen durcb hoxaologer Reko:ca.xnatxon 

Oder Einbringen von sequenzspezifischeri Nukleasen gegen 
Markerprotein-Genseduenzen generiert werden. 

20 De. Facb^ann ist bekannt, dass aucb weitere ^^^f^^^^^^Zs 
der vorliegenden Erfindung zur Verminderung exnes ^arkerprotexns 
bzw seine? Aktivitat oder Funktion eingesetzt werden konnen^ 
BelspLlsweise kann aucb - je nacb Art des verwendeten Marker- . 
protSins - das Einbringen einer dominant -negativen Varxante exnes 
25 Srke^roteins oder einer deren Expression gewSbrlexstenden 

^feXionLassette vorteilbaft sein. Babei kann ^ edes exnzelne 
SSser Verfahren eine Verminderung der Expressxon, Menge Aktxvx 
Sr^dToder Funktion eines Markerproteins bewirken. ^-b -ne 
^ollSerte Anwendung ist denkbar. Weitere Methoden sxnd dem 
30 bek^t und^annen die Bebinderung oder 

der Prozessierung des Markerproteins. J^^^^^Hl^t^ 
r,roteins oder dessen mRNA, Henffliung der Ribosomenanlagerung , 
H^^a des ^-SpleiEens. Induktion eines Markerprotein-HNA 
^IZd^E^ und/oder Henoaung der Translationselongatxon 
35 Oder -termination umfassen^ 

Die einzelnen bevorzugten Verfabren seien infolge durch beispiel- 
hafte Ausftibrungsformen beschxieben: 

40 a) Einbringen einer doppelstrangigen RibonukleinsSuresequenz 
eines Markerproteins (MP-dsRNA) 



Das verfabren der Genregulation mittels doppelstrangxger ENA 
rSoSL-stranded BNA interference'; dsPNAi) xst vxelfacb 
fi^ tierische und pflanzliche Organismen beschrxeben (z.B. 
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WO 00/44914; WO 00/44895; WO 00/49035; WO 00/63364). Auf die 
in den angegebenen Zitaten beschriebenen Verfabren und Methoden 
wird hiermit ausdrucklich Bezug genoinmen. dsRNAi-Verf ahren 
beruhen auf dem Phanomen, dass durch gleichzeitiges Einbringen 
5 von komplementaren Strang- und Gegenstrang eines Gentranskriptes 
eine hochef f iziente Unterdrttckung der Expression des ent- 
sprechenden Gens bewirkt wird. Der bewirkte PhSnotyp kommt 
dem einer entsprechenden 3cnock-out Mutanten sehr ahnlich (Water- 
house PM et al . (1998) Proc Natl Acad Sci USA 95 : 13959-64) • Das 
10 dsRNAi-Verf ahren hat sich bei der Verminderting der Markerprotein- 
Expression als besonders effizient und vorteilhaft erwiesen. 

Doppelstrangiges RNA-Molektil meint im Rahmen der Erfindiang bevor- 
zugt eine oder mehr Ribonukleinsauresequenzen , die aufgrund 

15 komplementarer Sequenzen theoretisch (z.B. gemafi den Basenpaar- 
regein von Waston \ind Crick) xand/oder faktisch (z.B. aufgrund 
von Hybridisierungsexperimenten in vitro vind/oder in vivo) in 
der Lage sind, doppelstrangige PNA-Strukturen auszubilden. Dem 
Fachmann ist bewusst, dass die Ausbildung von doppelstrangigen 

20 RNA-Strukturen, einen Gleichgewichtszustand darstellt. Bevor- 
zugt ist das VerhSltnis von doppelstrangigen Molekiilen zu ent- 
sprechenden dissozierten Formen mindestens 1 zu 10, bevorzugt 
1:1, besonders bevorzugt 5:1, am meisten bevorzugt 10:1. 

25 Ein weiterer Gegenstand der Erfindung bezieht sich daher 
auf doppelstrangige RNA-Molekaie (dsRNA-Molekule) , die bei 
Einbringen in einen pflanzlichen Organismus (oder eine davon 
abgeleitete Zelle, Gewebe, Organ oder Vermehr\ingsmaterial) 
die Verminderung mindestens eines Markerproteins bewirken. 

30 Das doppelstrangige RNA-Molekul zur Vermindervmg der Expression 
eines Markerproteins (MP-dsRNA) umfasst dabei bevorzugt 

a) einen sense "-RNA-Strang xamfassend mindestens eine Ribo- 
nukleotidsequenz , die im wesentlichen identisch ist zu 

35 itiindestens einem Teil des sense "-Rl^A-Transkriptes einer 

Nukleinsauresequenz kodierend fiir ein Markerprotein, und 

b) einen ^antisense^-RNA-Strang, der zu dem RNA-^sense^-Strang 
unter a) im wesentlichen - bevorzugt vollstSndig - komplemen- 

40 taren ist. 

In Bezug auf die dsRNA-Molekule meint Markerprotein-Nukleinsaure- 
sequenz bevorzugt eine Sequenz gemaS SEQ ID NO: 1, 3, 5, 7, 9, 
11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 
45 43, 45 Oder 47 oder ein funktionelles Aquivalent derselben. 
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"in. wesentliclxen identisch^ Jfnt, dass die dsHNA Secxuenz auch 
insertionan, Deletionen sowie einzelne Punktmutatxonen ^ Ver 
gleich zu der Markerprotein Zielsecjaenz aufwexsen kj^.^^ 
Lnnoclx eine ef fizient Vermindarung dar Exprassxon ^ewxrkt^ 
5 Bevorzugt batrSgt dia Homologia (nach waxtar ^^^^ 

Dafinition) mindastans 75 %, bavorzugt mxndastans 80 %, ganz 
basonders bevorzugt mindastans 90 % am — * 
zwiscban dara -sansa" -Strang einer 

mindastens ainam Tail das "sansa-KNA-Translcrxptas axnar Nuklaxn 
10 ^urasacxuanz kodiarand fOr ain M^karprotain (bzw. ---^^ ^_ 
»antisanse-Strang dara komplamantaran Strang axnar Nuklaxnsaure 
saquenz kodierend fiir ain Markerprotexn) . 

Eina 100%iga Saquenz identi tat zwischan dsKNA und ainam Markar- 
X5 pr'ain GaStranSript ist nicbt zwxngand -^^^^^^f ' ^"^^^^^ 

effizianta Varmindarung dar Markarprotain Exprassxon zu bawxrken. 
Bimz^fJlga bastabt dar Vortail. dass das Varfahran tolerant 
ist gaganiiber Sequenzabweichungen, wia sxe xnfolge ganetxschar 
^tafionan, Polymorpbisman odar -olution^rar Divarganze^^^ 
lieaen konnen. So ist as beispialswaisa moglich mxt der dsRNA. 
dia lusgeSnd von der Markarprotain Saquenz das einan Organxsmus 
ganaSarJ wurda, dia Markerprotein Expression in an^aran 
Organismus zu untardriickan . Dies ist basondars dann vortaxlhaft, 
waL als Markerprotein ain pf lanzanaiganes. 

protein verwendat wird (beispialswaisa axna 5-Mathylthxorxbose 
kinase oder Alkoholdahydroganase) . Zu diasam Zweck mafasst 
die dsRNA bevorzugt Sequenzbereiche von Markerprotexn-Gen- 
tranSS^pten. die konservierten Baraichan -tsprecban _Besagta 
konservierte Bereicha k5nnen aus Sequanzverglexchan lexcht 
abgeleitet warden. 

Dia LSnga des Teilabschnittes batragt mindastens 10 Basen, 
bavorzugt mindastens 25 Basen, besonders bevorzugt mxndestans 
50 Basen, ganz besonders bevorzugt mindastens 100 ^ 
maistan bevorzugt mindastens 200 Basen odar mxndestens 300 Basen. 

Altarnativ, kann eina "Im wesantlichan identiscbe" dsBHA --^^.^^^ 
^Je^nsauiesequenz definiart warden, die befSMgt ist, mxt exnam 

Snes Markarprotain Gantranskriptas zu bybridisxaran (z B 
IrioO^^ NaCl, 40 mM PIPES pH 6,4, 1 x.^ EDTA bai 50«C Oder 70 C 
*° fur 12 bis 16 h) . 

»ln. wesantlichen komplementar" maint, dass der "antisanse''- 
BNA-Strang auch Insertionan, Dalationen sowxe exnzalna Punkt- 
mutationen im Vargleich zu dam Komplement des 'sansa'-BNA- 
« Granges aufwaisen kann. Bevorzugt batragt dia Homologxa mxn- 

dei^C 80 %, bavorzugt mindastans 90 %, ganz besonders bavorzugt 
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mindestens 95 %/ am meisten bevorzugt 100% zwischen dem anti- 
sense "-RNA-Strang \and dem Komplement des sense " -RNA-Stranges . 

*'Teil des " sense "-RMA-Transkriptes" einer Nukleinsauresec[uenz 
5 kodierend fur ein Markerprotein meint Fragmente einer RNA oder 
mRNA transkribiert oder transkribierbar von einer f\ir ein Marker- 
protein kodierenden Nukleinsauresequenz , bevorzugt von einem 
Markerprotein-Gen. Dabei haben die Fragmente bevorzugt eine 
Sequenzlange von mindestens 20 Basen, bevorzugt mindestens 

10 50 Basen, besonders bevorzugt mindestens 100 Basen, ganz 

besonders bevorzugt mindestens 200 Basen, am meisten bevorzugt 
mindestens 500 Basen. Umfasst ist auch die vollstSndige 
transkribierte RNA oder mRNA. Umfasst sind auch Sequenzen wie 
sie unter kiinstlichen Bedingungen von Regionen eines Marker- 

15 protein-Gens transkribiert werden konnen, die ansonsten - unter 
natiirlichen Bedingungen - nicht transkribiert werden, wie bei- 
spielsweise Promotorregionen. 

Die dsRNA kann aus einem oder mehr Strangen von Polyribonukleo- 
20 tiden bestehen. Naturlich konnen, urn den gleichen Zweck zu 

erreichen, auch mehrere individuelle dsimA Molektile, die jeweils 
einen der oben def inierten Ribonukleotidsecjuenzabschnitte um- 
fassen, in die Zelle oder den Organismus eingebracht werden. Die 
doppelstrangige dsRNA-Struktur kann ausgehend von zwei komplemen- 
25 tar en, separaten RNA-StrSngen oder - bevorzugt - ausgehend von 
einem einzelnen, selbstkomplementSren RNA-Strang gebildet werden. 
In diesem Fall sind sense "-RNA-Strang und ^^antisense" -RNA-Strang 
bevorzugt kovalent in Form eines invert ier ten ^Repeats" mitein- 
ander verbunden. 

30 

Wie z.B. in WO 99/53050 beschrieben, kann die dsRNA auch eine 
Haarnadelstruktur umfassen, indem "sense"- und "antisense" -Strang 
durch eine verbindende Secruenz ("Linker"; beispielsweise ein 
Intron) verbunden werden. Die selbstkomplementaren dsRNA-Struk- 

35 turen sind bevorzugt, da sie lediglich die Expression einer RNA- 
Sequenz erfordem und die komplementaren RNA-StrSnge stets in 
einem Sguimolaren Verbal tnis umfassen. Bevorzugt ksinn ist die 
verbindende Sequenz ein Intron (z.B, ein Intron des ST-LSl Gens 
aus Kartoffel; Vancanneyt GF et al. (1990) Mol Gen Genet 

40 220(2) :245-250) . 

Die NukleinsSuresequenz kodierend fvir eine dsRNA kann weitere 
Elemente beinhalten, wie beispielsweise Transkriptionstermina- 
tionssignale oder Polyadenylierungssignale. 
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q«llen die zwei Strange der dsRNA in einer Zelle oder Pflanze 
'usalen^™t werdL, so Kann dies beispielhaft auf fol^ende 

Art gescliehen: 

5 a) Transformation der Zelle oder Pflanze mit einem Vektor, der 
beide Expressionskassetten umfasst, 

b) Kotransformation der Zelle oder Pflanze mit zwei Vektoren, 
' wobei der eine die H^ressionskassetten mit dem "^e-^; 
10 Strang, der andere die Expressionskassetten mxt dem antx 

sense'' -Strang lamfasst. 

Die Bildung der RNA Duplex kann entweder auSerhalb der Zelle oder 
innerhalb derselben initiiert werden. 

" Die dsRNA kann entweder in vivo oder in vitro synthetisiert 
wiJden Dazu kann eine DNA-Secjuenz kodierend fflr exne dsFNA 

S3t-==— ^^^^^^^ 

In eine« Trans£=r«iationsvsktor insertiert und mit den unCen 

zu exprimierenden BHA sein, indem sie bexspxelswexse an den 
3'-untran8latierten Teil besagter RNA fusxonxert wird. 

" Die dsPHA kann in einer Menge eingeftihrt werden die ^-^-^^^ 
eine Kopie pro Zelle ermSglicht. H5here Mengen (z.B. ^^^^^^^ens 
5 lo 100, 500 Oder 1000 Kopien pro Zelle) k5nnen ggf • exne 
effizienter Verminderung bewirken. 

" b) Einbringen einer antisense-RibonukleinsSureseqaenz eines 
Markerproteins (MP-antisenseRNA) 

Verf ahren zur Verminderung eines ^estimraten Proteins^durch die 
45 «antisense-Technologie sind v.elfach - ^^f ^^^/f^f g^. 
beschrieben (Sheehy et al. (1988) Proc ^^^^^f J^^f " 
8805-8809; US 4,801.340; Mol JN et al. (1990) FEBS Lett 
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268 (2) : 427-430) . Das antisense Nukleinsauremolektil hybridisiert 
bzw. bindet mit der zellulSren mRNA land/oder genomischen DNA 
kodierend ftir das zu vermindernde Markerprotein. Dadurch wird 
die Transkription und/oder Translation des Markerproteins iinter- 
druckt. Die Hybridisieriing kann auf konventionelle Art ttber die 
Bildung einer stabilen Duplex oder - im Fall von genomischer 
DNA - durch Bindung des antisense Nukleinsauremolekiils mit der 
Duplex der genomischen DNA durch spezifische Wechselwirkung in 
der groSen Furche der DNA-Helix entstehen. 



10 



15 



Eine MP-antisenseRNA kann xxnter Verwendung der far dieses 
Markerprotein kodierenden Nukleinsauresequenz , beispielsweise 
der Nukleinsauresequenz gemaS SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 
15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45 
Oder 47 nach den Basenpaarregeln von Watson vmd Crick abgeleitet 
werden. Die MP-antisenseRNA kann zu der gesamten transkribierten 
mRNA des Markerproteins komplementar sein, sich auf die kodie- 
rende Region beschranken oder nur aus einem Oligonukleotid be- 
stehen, das zu einem Teil der kodierenden oder nicht-kodierenden 
Sequenz der mRNA komplementar ist. So kann das Oligonukleotid 
beispielsweise komplementar zu der Region sein, die den Trans- 
lationsstart fiir das Markerprotein umfasst. Die MP-antisenseRNA 
kann eine L^nge von zum Beispiel 5, 10, 15, 20, 25, 30, 35, 40, 
45 Oder 50 Nukleotide haben, kann aber auch linger sein und min- 
destens 100, 200, 500, 1000, 2000 oder 5000 Nukleotide umfassen. 
25 ]yip-antisenseRNA werden im Rahmen des erf indungsgemaSen Verfahrens 
bevorzugt rekombinant in der Zielzelle exprimiert. 

Die MP-antisenseRNA kann auch Teil einer von der zu insertieren- 
den NTikleinsauresequenz zu exprimierenden RNA sein, indem sie 
30 beispielsweise an den 3 ' -untranslatierten Teil besagter RNA 
fusioniert ist. 

Ein weiterer Gegenstand der Erfindung betrif ft trsinsgene 
Expressionskassetten enthaltend eine Nukleinsauresequenz 

35 kodierend fur zumindest einen Teil eines Markerproteins, wobei 
besagte Nukleinsauresequenz mit einem in pflanzlichen Organismen 
funktionellen Promotor in antisense-Orientierung funktionell 
verknupf t ist . Besagte Expressionskassetten konnen Teil eines 
Transformationskonstruktes oder Trans formationsvekt or s sein, oder 

40 aber auch im Rahmen einer Kotransf ormation eingefiihrt werden. 

In einer weiteren bevorzugten Aus fuhrungs form kann die Expression 
eines Markerproteins durch Nukleotidsequenzen inhibiert werden, 
die komplementar zu der regulatorischen Region eines Marker- 
protein-Gens (z.B. einem Markerprotein Promoter und/oder 
Enhancer) sind und triple-helikale Strukturen mit der dortigen 
DNA-Doppelhelix ausbilden, so dass die Transkription des Marker- 
protein-Gens vermindert wird. Entsprechende Verfahren sind 
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beschrieben (Helene C (1991) Anticancer Drug Res ^ (6) :569-84; 
Helena C et al. (1992) Ann NY Acad Sci 660:27-36; Maher LJ (1992) 
Bioassays 14(12) : 807-815) . 

5 in einer weiteren Ausfuhrungsf orm kann die MP-antisenseBNA eine 
a-anomere NukleinsSure sein. Derartige a-anomere Nuklexnsaure- 
xaolekule bilden spezif ische doppelstrangige Hybrxde m^t komple- 
mentarer RNA in denen, - im Unterschied zu den konventxonellen 
P-Nukleinsauren - die beiden Strange parallel --nander verlaufen 
(Gautier C et al. (1987) Nucleic Acids Res 15:6625-6641). 

c) Einbringen einer MP-antisenseENA kambiniert mit einem Ribozym 

Vorteilhaf t kann die oben beschriebene antisense-Strategie mit 
einem Ribozym-Verf ahren gekoppelt werden. Katalytxsche RNA-Mole- 
" kale Oder Ribozyme kSnnen an jede beliebige Ziel-RNA angepasst 
werden imd spalten das Phosphodiester-Gerttst an spezxfischen 
Positionen, wodurch die Ziel-RNA funktionell deaktivxert wxrd 
(Tanner NK (1999) FEMS Microbiol Rev 23 (3) : 257-275) . Das Rxbozym 
wird dadurch nicht selber modifiziert, sondem ist xn der Lage, 
2° weitere Ziel-RNA-Molekiile analog zu spalten, wodurch es dxe 
Eigenschaften eines Enzyms erhait. Der Einbau von Rxbozym- 
sequenzen in »antisense"-RNAs verleiht eben diesen antx- 
sense-BNAs diese enzymahnliche. RNA-spaltende Exgenschaft ^d 
steigert so deren Effizienz bei der Inaktivierung der Zxel-BNA. 
25 Die Herstellung und Verwendung entsprechender Ribozym- antx- 
sense"-RNA-Molek{ile ist beschrieben (u.a. bei Haseloff et al. 
^98^) ™ 334: 585-591); Haselhoff und ^erlach (1988) Nature 
334:585-591; Steinecke P et al. (1992) < J> = " J^" 

de Feyter R et al. (1996) Mol Gen Genet. 250(3) :329-338) . 

Auf diese Art konnen Ribozyme (z.B. «Hammerhead''-Ribozyme; 
Haselhoff und Gerlach (1988) Nature 334:585-591) verwendet 
werden, um die mRNA eines zu vermindernden Markerprotexns 
katalytisch zu spalten und so die Translation zu verhxndern. 
35 Die Ribozym-Technologie kann die Effizienz einer antxsense- 
Strategie erhShen. Verfahren zur Expression von Ribozymen 
zur Verminderung bestimmter Proteine sind beschrxeben xn 
(EP 0 291 533, EP 0 321 201, EP 0 360 257). In pflanzlxchen 
Zellen ist eine Ribozym-Expression ebenfalls beschrxeben 
« (StiSecke P et al. (1992) EMBO J 11 (4) : 1525-1530 ; de Feyter R . 
* et al. (1996) Mol Gen Genet. 250 (3 ) :329-338) . Geexgnete Zxel- 
sequenzen und Ribozyme kSnnen zum Beispiel wie bex "Stexnecke P. 
Ribozymes, Methods in Cell Biology 50, Galbraxth et al^ eds. 
Academic Press, Inc. (1995), S. 449-460" beschrxeben, durch 
.5 sekundarstrukturberechnungen von Ribozym- und 

durch deren Interaktion bestimmt werden (Bayley CC et al. (1992) 
Plant Mol Biol. 18 (2) :353-361; Lloyd AM and Davxs RW et al. 
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(1994) Mol Gen Genet. 242 ( 6) : 653-657) . Beispielsweise konnen 
Derivate der Tetrahymena L-19 IVS KNA konstruiert werden, die 
komplementare Bereiche zu der mRNA des zu supprimierenden Marker- 
proteins aufweisen (siehe auch US 4,987,071 xand US 5,116,742). 
5 Alternativ konnen solche Ribozyine auch liber einen Selektions- 
prozess aus einer Bibliothek diverser Ribozyme identif iziert 
werden (Bartel D und Szostak JW (1993) Science 261:1411-1418). 

d) Einbringen einer sense-RibonukleinsSuresequenz eines Marker- 
3_Q proteins (MP-senseRNA) zur Indiiktion einer Kosuppression 

Die Expression einer Markerprotein Ribonukleinsauresequenz 
(Oder eines Teils derselben) in sense-Orientienmg kann zu einer 
Kosuppression des entsprechenden Markerproteingens fiihren. Die 

-|_5 Expression von sense-RNA mit Homologie zu einem endogenen Marker- 
proteingen kann die Expression desselben vennindern oder aus- 
schalten, ahnlich wie es filr antisense AnsStze beschrieben wurde 
(Jorgensen et al. (1996) Plant Mol Biol 31 (5 ): 957-973 ; Goring 
et al. (1991) Proc Natl Acad Sci USA 88:1770-1774; Smith et al. 

20 (1990) Mol Gen Genet 224:447-481; Napoli et al. (1990) Plant Cell 
2:279-289; Van der Krol et al. (1990) Plant Cell 2:291-99) . Dabei 
kann das eingef lihrte Konstrukt das zu vermindemde , homologe 
Gen ganz oder nur teilweise reprasentieren . Die Moglichkeit 
zur Translation ist nicht erf order lich. Die Anwendung dieser 

25 Technologie auf Pflanzen ist beschrieben (z.B. Napoli et al. 
(1990) Plant Cell 2:279-289; in US 5,034,323. 

Bevorzugt wird die Kosuppression unter Verwendung einer Sequenz 
realisiert, die im wesentlichen identisch ist zu zumindest einem 
30 Teil der NukleinsSuresequenz kodierend far ein Markerprotein, 
beispielsweise der Nukleinsauresequenz gemaS SEQ ID NO: 1, 3, 
5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29 ,31, 33, 35, 
37, 39, 41, 43, 45 oder 47. 

35 Bevorzugt ist die MP-senseRNA so gewahlt, dass es nicht zu einer 
Translation des Markerproteins oder eines Teils desselben kommen 
kann. Dazu kann beispielsweise der 5'-untranslatierte oder 
3 ' -untranslatierte Bereich gewShlt oder aber das ATG-Startkodon 
deletiert oder mutiert werden. 



40 



e) Einbringen von DNA-oder Protein-bindende Faktoren gegen 
Markerprotein Gene, -KNAs oder Proteine 



Eine Verminderung einer Markerprotein Expression ist auch mit 
45 spezifischen DNA-bindenden Faktoren z.B. mit Faktoren vom Typ der 
Zinkf ingertranskriptionsfaktoren mdglich. Diese Faktoren lagem 
sich an die genomische Se<iuenz des endogenen Zielgens, bevor- 
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20 
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zugt in den regulatorischen Bereichen. an und bewirken eine Ver- 
minderung der Expression. Entsprechende Verfahren zur Herstellung 
entsprechender Faktoren sind beschrieben (Dreier B et al . (2001) 
J Biol Chem 276 (31) :29466-78; Dreier B et al. (2000) J Mol 
5 Biol 303 (4) -.489-502; Beerli RR et al. (2000) Proc Natl Acad 
Sci USA 97 (4): 1495-1500; Beerli RR et al . (2000) J Biol Chem 
275(42) -32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 
Opin Chem Biol 4(l):34-39; Kang JS and Kim JS (2000) J Biol Chem 
275(12): 8742-8748; Beerli PR et al. (1998) Proc Natl Acad Sex USA 
95(25):14628- 14633; Kim JS et al . (1997) Proc Natl Acad Sci USA 
94(8). 3616 -3620; Klug A (1999) J Mol Biol 293 (2) -.215-218; Tsai 
SY et al (1998) Adv Drug Deliv Rev 30 (1-3) : 23-31; Mapp AK et al. 
(2000) Proc Natl Acad Sci USA 97 (8) : 3930-3935 ; Sharrocks AD 
et al. (1997) Int J Biochem Cell Biol 29 (12) : 1371-1387 ; Zhang L 
et al. (2000) J Biol Chem 275 (43) :33850-33860) . 

Die Selektion dieser Faktoren kann unter Verwendiong eines 
beliebigen Sttickes eines Markerprotein-Gens erfolgen. Bevorzugt 
liegt dieser Abschnitt im Bereich der Promotorregion. Fttr erne 
Genunterdruckung kann er aber auch im Bereich der kodierenden 
Exons Oder Introns liegen. 

Femer kSnnen Faktoren in eine Zelle eingebracht werden, die das 
Markerprotein selber inhibieren. Diese proteinbindenden Faktoren 
kSnnen z.B. Aptamere (Famulok M und Mayer G (1999) Curr Top 
Microbiol Immunol 243:123-36) oder AntikSrper bzw. AntikSrper- 
fragmente oder einzelkettige Antik6rper sein. Die Gewinnung die- 
ser Faktoren ist beschrieben (Owen M et al. (1992) Biotechnology 
(N Y) 10(7) :790-794; Franken E et al. (1997) Curr Opin Biotechnol 
8(4) :411-416; Whitelam (1996) Trend Plant Sci 1:286-272). 

30 

f ) Einbringen von den Markerprotein RNA-Abbau bewirkenden 
viralen NukleinsSuresequenzen und Expressionskonstrukten 

Die Markerprotein Expression kann effektiv auch durch Induktion 
des spezifischen Markerprotein RNA-Abbaus durch die Pflanze 
mit Hilfe eines viralen Expressionssystems (Amplikon; Angell 
SM et al. (1999) Plant J 20 (3 ) :357-362) realisiert werden. 
Diese Systeme - auch als "VIGS" (viral induced gene silencing) 
bezeichnet - bringen Nukleinsaureseguenzen mit Homologie 
*° zu dem Transkript eines zu vermindemden Markerproteins 

mittels viraler Vektoren in die Pflanze ein. Die Transkription 
wird sodann - vermutlich mediiert durch pflanzliche Abwehr- 
mechanismen gegen Viren - abgeschaltet . Entsprechende Techniken 
und Verfahren sind beschrieben (Ratcliff F et al. (2001) Plant J 
*^ 25(2) -237-45; Fagard M und Vaucheret H (2000) Plant Mol Biol 
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43 (2-3) :285-93; Anandalakshmi R et al. (1998) Proc Natl Acad Sci 
USA 95(22) :13079-84; Ruiz MT (1998) Plant Cell 10 (6) : 937-46 ) . 

Bevorzugt wird die VTGS-vennittelte Verminderung unter Verwendung 
5 einer Sequenz realisiert, die iiti wesentliclien identisch ist 
zu ziunindest einem Tail der NxikleinsSuresequenz kodierend ftir 
ein Markerprotein, beispielsweise der Nukleinsauresequenz gemaS 
SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 
29, 31, 33, 35, 37, 39, 41, 43, 45 oder 47. 

10 

g) Einbringen von Konstrukten zur Erzeugxang eines Funktions- 
verlustes oder einer Funktionsminderung an Markerprotein- 
Genen 

15 Dem Fachmann sind zahlreiche Verfahren bekannt, wie genomische 
Sequenzen gezielt modifiziert werden konnen. Dazu zahlen ins- 
besondere Verfahren wie die Erzeugimg von Knockout-Mutanten 
mittels gezielter homologen Rekoinbination z.B. durch Generierung 
von Stopp-Kodons , Verschiebiingen im Leseraster etc. (Hohn B imd 

20 Puchta H (1999) Proc Natl Acad Sci USA 96:8321-8323) oder die 
gezielte Deletion oder Inversion von Sequenzen mittels z.B. 
sequenzspezif ischer Rekombinasen oder Nukleasen (s.u.) 

In einer bevorzugten Ausfuhrungsf orm wird die Inaktivierung des 
25 Markerprotein-Gens dxirch Einbringen einer sequenzspezif ischen 

Rekombinase realisiert. So kann beispielsweise das Markerprotein- 
gen Erkennxmgs sequenz en fiir sequenzspezif ische Rekombinasen 
umfassen oder von solchen f lankier t sein, wobei dann durch 
Einbringen der Rekombinase bestimmte Sequenzen des Markerprotein- 
30 gens deletiert oder invertiert werden und so eine Inaktivierung 
des Markerproteinsgens erfolgt. Ein entsprechendes Vorgehen ist 
schematisch in Fig. 1 dargestellt. 

Entsprechende Verfahren zur Deletion/Inversion von Sequenzen 
35 mittels sequenzspezif ischer Rekombinasesysteme sind dem Fachmann 
bekannt. Beispielhaf t seien zu nennen das Cre/lox-System des 
Bacteriophagen Pi (Dale EC und Ow DW (1991) Proc Natl Acad 
Sci USA 88:10558-10562; Russell SH et al. (1992) Mol Gen Genet 
234:49-59; Osborne BI et al. (1995) Plant J 7:687-701), das FLP/ 
40 FRT System der Hefe (Kilby NJ et al. (1995) Plant J 8:637-652; 
Lyznik LA et al. (1996) Nucl Acids Res 24:3784-3789), die Gin 
Rekombinase des Mu Phagen, die Pin Rekombinase aus E.coli oder 
das R/RS System des pSRl Plasmids (Onouchi H et al.(1995) Mol Gen 
Genet 247:653- 660; Sugita Ket al. (2000) Plant J. 22:461-469). 
45 Bei diesen Systemen interagiert die Rekombinase (beispielsweise 
Cre oder FLP) spezifisch mit ihren jeweiligen Rekombinations- 
sequenzen (34 bp lox-Sequenz bzw. 47 bp FRT-Sequenz) . Bevorzugt 
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sind das Bacteriophagen Pi Cre/lox und das Hefe FLP/FRT System. 
Das FLP/FRT und cre/lox Rekombinasesystem \AAirde bereits in 
pflanzlichen Systemen angewendet (Odell et al . (1990) Mol 
Gen Genet 223:369-378). Das Eiiibringen der Rekombinase wird 
5 bevorzugt mittels rekombinanter Expression ausgehend von einer 
auf einem DNA-Konstrukt umfassten Expressionskassette realisiert. 

Die Verminderung der Markerprotein-Aktivitat oder -Menge kann 
auch. durch eine gezielte Deletion im Markerprotein-Gen z.B. durch 

10 seciuenzspezifiscbe Induktion von DNA-Doppelstrangbriichen an einer 
Erkennungsseqrienz zur gezielten Induktion von DNA-Doppelstrang- 
brtichen in oder in der Nahe der Nukleinsauresequenz kodierend 
filr ein Markerprotein realisiert werden. In seiner einfachsten 
AusfOhrungsform (vgl. Fig. 2, A imd B) wird hierbei ein Enzym 

15 mit dem Trans formationskonstrukt eingebracht, dass mindestens 
einen Doppelstrangbruch derart erzeugt, dass die resultierende 
illegitime Rekombination oder Deletion eine Vermindervmg der 
Markerprotein-Aktivitat oder -Menge - beispielsweise durch 
Induzieren einer Verschiebung im Leseraster oder Deletion 

20 essentieller Sequenzen - bewirkt. 

Die Effizienz dieses Ansatz kann gesteigert werden, indem die 
Sequenz kodierend fiir das Markerprotein von Sequenzen (A bzw. A' ) 
flankiert ist, die eine ausreichende Lange und Homologie zuein- 

25 ander haben, um infolge des induzierten Doppelstrangbrucbes mit- 
einander zu rekombinieren und so - durch eine intramolekulare 
homologe Rekombination - eine Deletion der Sequenz kodierend fur 
das Markerprotein zu bewirken. Ein entsprechendes Vorgehen ist 
in einer beispielhaf ten Ausfuhrimgsf orm dieser Variante in Fig. 3 

30 schematisch dargestellt. 

Die Verminderung der Markerprotein-Menge , -Funktion \ind/oder - 
Aktivitat kann auch durch eine gezielte Insertion von Nuklein- 
sauresequenzen (z.B. der im Rahmen der erf indungsgemafien Ver- 

35 fahrens zu insertierenden Nukleinsauresequenz) in die Sequenz 
kodierend ftlr ein Markerprotein (z.B. mittels intermolekularer 
homologer Rekombination) realisiert werden. Diese Ausfuhrungsf orm 
des erf indungsgemafien Verfahrens ist besonders vorteilhaft und 
bevorzugt, da es neben den allgemeinen Vorteilen des erfindiings- 

40 gemaSen Verfahrens zudem noch eine reproduzierbare, vorhersag- 
bare, ortsspezif ische Insertion der zu insertierenden Nuklein- 
sauresequenz in das pf lanzliche Genom ermoglicht . Dadurch werden 
die ansonsten im Rahmen einer zufalligen, ortsunspezif ischen 
Insertion auftretenden Posit ionseffekte (die sich beispielsweise 

45 in Form von unterschiedlichen Expressionshohen des Transgens oder 
einer unbeabsichtigen Inaktivierung endogener Gene aufiem konnen) 
vermieden. Im Rahmen dieser Ausftihrungsf orm verwendet man als 
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^anti-Markerprotein^-Verbindung bevorzugt ein DNA-Konstrukt , 
das zximiiidest einen Teil der Sequenz eines Markerproteingens 
Oder benachbarter Sec[uenzen lomfasst, xind so mit diesen in 
der Zielzelle gezielt rekombinieren kann, so dass durch eine 
5 Deletion, Addition oder Substitution mindestens eines Nukleotids 
das Markerproteingen so verSLndert wird, dass die Funktionalitat 
des Markerprotein-Gens vermindert oder ganzlich aufgehoben wird. 
Die Ver&aderung kann auch die regulativen Elemente (z.B. 
den Promotor) des Markerprotein-Gens betreffen, so dass 

10 die kodierende Sequenz xinverSndert bleibt, eine Expression 
(Transkription und/oder Translation) jedoch \interbleibt und 
veimindert wird. Bei der konventionellen homologen Rekombination 
ist die zu insertierende Sequenz an ihrem 5'- und/oder 3'-Ende 
von weiteren NukleinsSuresequenzen (A' bzw. B' ) flankiert, die 

15 eine ausreichende LSnge uxid Homologie zu entsprechenden Sequenzen 
des Markerprotein-Gens (A bzw. B) fiir die ErmoglichvLng der homo- 
logen Rekombination aufweisen. Die Lange liegt in der Regel in 
einem Bereich von mehreren hundert Basen bis zu mehreren Kilo- 
basen (Thomas KR und Capecchi MR (1987) Cell 51:503; Strepp 

20 et al. (1998) Proc Natl Acad Sci USA 95 (8) : 4368-4373) . Fiir 

die homologe Rekombination wird die pflanzliche Zelle mit dem 
Rekombinationskonstrukt \mter Verwendung der unten beschriebenen 
Verfahren transf ormiert und erfolgreich rekombinierte Klone 
basierend auf dem infolge inaktivierten Markerprotein selektio- 

25 niert. Obgleich homologe Rekombination ein relativ seltenes 

Ereignis in pflanzlichen Organismen ist, kann durch die Rekombi- 
nation in das Markerprotein-Gen hinein einem Selektionsdruck aus- 
gewichen werden, was eine Selektion der rekombinierten Zellen 
und eine hinreichende Effizienz des Verfahrens erla\ibt. Ein ent- 

30 sprechendes Vorgehen ist in einer beispielhaf ten Ausfuhrxingsf orm 
dieser Variante in Fig. 4 schematisch dargestellt. 

In einer vorteilhaf ten Ausfiihrungsf orm der Erfindung wird 
jedoch die Insertion in das Markerproteingen mitt els weiterer 

35 Funktionselemente erleichtert. Der Begriff ist umfassend zu ver- 
stehen und meint die Verwendung von Sequenzen bzw. von diesen 
abgeleiteten Transkripten oder Polypeptiden, die die Effizienz 
der gezielten Integration in ein Markerprotein-Gen zu steigern 
vermogen. Dazu stehen dem Fachmann verschiedene Verfahren zur 

40 Verfiigung. Bevorzugt wird jedoch die Insertion durch Induktion 
eines sequenzspezif ischen Doppelstrangbruches in oder in der 
Nahe des Markerprotein-Gens realisiert. 

In einer bevorzugte Ausfiihrungsf orm der Erfindung wird die 
45 Inaktivierung (d.h. die Verminderxing der Menge, Expression, 
Aktivitat Oder Funktion) des Markerproteins durch Integration 
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einer DNA-Sequenz in ein Markerprotein-Gen realisiert, wobei 
das Verfahren bevorzugt nachf olgende Schritte umfasst: 

i) Einbringen eines Insertionskonstruktes und mindestens eines 
5 Enzyms geeignet zur Induktion von DNA-Doppelstrangbrttchen 

an einer Erkenniingssequenz zur gezielten Induktion von DNA- 
Doppelstrangbrtichen in oder in der NMhe des Markerprotein- 
Gens , und 

ii) Induktion von DNA-Doppelstrangbriichen an den Erkennungs- 
10 sequenzen zur gezielten Induktion von DNA-Doppelstrang- 
briichen in Oder in der Nahe des Markerprotein-Gens , und 

iii) Insertion des Insertionskonstruktes in das Markerprotein- 
Gen, wobei die F^lnktionalitat des Markerprotein-Gens und 

15 - bevorzugt - die Funktionalitat der Erkennungssequenz zur 

gezielten Induktion von DNA-Doppelstrangbriichen inaktiviert 
wird, so dass besagte Erkeimungssequenz nicht mehr durch 
das Enzym geeignet zur Induktion von DNA-Doppelstrang- 
briichen geschnitten werden kann, und 

20 . ^ 

iV) Selektion von Pflanzen oder pflanzlichen Zellen, bei denen 
das insertionskonstrukt in das Markerproteingen insertiert 
wurde. 

25 Das Insertionskonstrukt umfasst - bevorzugt - die in das Genom 
zu insertierende Nukleinsaureseguenz, kann aber auch separat von 
dieser eingesetzt werden. 

"Enzym geeignet zur Induktion von DNA-Doppelstrangbrtichen an der 
Erkennungssequenz zur gezielten Induktion von DNA-Doppelstrang- 
30 briichen- (infolge "DSBI-Enzym" fiir "double gtrand-fcreak inducing 
eazisms'') meint allgemein all solche Enzyme, die in der Lage sind, 
sequenzspezifisch Doppelstrangbrflche in doppelstrSngige DNA 
zu erzeugen. Beispielsweise, aber nicht einschrSnkend, sind 
zu nennen: 

1. Restriktionsendonukleasen, bevorzugt Typ II Restriktionsendo- 
nukleasen, besonders bevorzugt Homing-Endonukleasen wie 
weiter Tjnten im Detail beschrieben. 

40 2. Kiinstliche Nukleasen wie weiter unten im Detail beschrieben. 

wie beispielsweise chimare Nukleasen, mutierte Restriktions- 
oder Homing-Endonukleasen oder RNA-Proteinpartikel aJageleitet 
von mobilen Introns der Gruppe II. 

45 Sowohl natiirliche als auch ktinstlich hergestellte DSBI-Enzyme 
sind geeignet. Bevorzugt sind all solche DSBI-Enzyme, deren 
Erkennungssequenz belcannt ist und die entweder in Form ihrer 
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Proteine (beispielsweise diirch Auf reinigimg) gewonnen oder unter 
Verwendiing ihrer Nukleinsauresequenz exprimiert werden konnen. 

Bevorzugt wird das DSBI-Enzym unter Kenntnis seiner spezifischen 
5 Erkennungssequenz so ausgewahlt, dass es zusStzlich zu der Ziel- 
Erkenmingssequenz keine weitere fiinktionellen Erkennungsregionen 
im Genom der Zielpflanze besitzt. Ganz besonders bevorzugt sind 
deshalb Homing-Endonukleasen (Ubersicht: Belfort M und Roberts RJ 
(1997) Nucleic Acids Res 25:3379-3388; Jasin M (1996) Trends 
10 Genet 12:224-228; Internet: http://rebase.neb.com/rebase/rebase. 
homing. html; Roberts RJ and Macelis D (2001) Nucl Acids Res 29: 
268-269) . Diese erfiillen aufgrund ihrer langen Erkenniings- 
sequenzen diese Anf order\ing . Die fur derartige Homing-Endo- 
nukleasen kodierenden Sequenzen konnen beispielsweise aus dem 
15 Chloroplastengenom von Chlamydomonas isoliert werden (Turmel M 
et al. (1993) J Mol Biol 232:446-467), Geeignete Homing-Endo- 
nukleasen sind unter der oben angegebenen Intemet-Adresse auf- 
geftihrt. Zu nennen sind beispielsweise Homing-Endonukleasen wie 
F-Scel, F-Scell, F-Suvl, F-TevI, F-TevII, I-Amal, I-Anil, I-Ceul, 
20 I-CeuAIIP, I-Chul, I-Cmoel, I-Cpal, I-Cpall, I-Crel, I-CrepsblP, 
I-CrepsbllP, I-CrepsblllP, I-CrepsblVP, I-CsmI, I-Cvul, I-CvuAIP, 
I-Ddill, I-Dirl, I-Dmol, I-HspNIP, I-Llal, I-Msol, I-Naal, 
I-NanI, I-NclIP, I-NgrIP, I-NitI, I-Njal, I-Nsp236IP, I-PakI, 
I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PoblP, I-Porl, 
25 I-PorllP, I-PpblP, I-Ppol, I-SPBetalP, I-Scal, I-Scel, I-Scell, 
I-Scelll , I-ScelV, I-SceV, I-SceVI, I-SceVII, I-SexIP, I-SnelP, 
I-SpomCP, I-SpomlP, I-SpomllP, I-SquIP, I-Ssp6803I, I-SthPhiJP, 
I-SthPhiST3P, I-SthPhiS3bP, I-TdelP, I-TevI, I-TevII, I-TevIII, 
I-UarAP, I-UarHGPAlP, I-UarHGPAl3P, I-VinIP, I-ZbilP, PI-MtuI, 
30 PI-MtuHIP, PI-MtuHIIP, Pl-Pful, Pl-PfuII, Pl-Pkol, Pl-PkoII, 

PI-PspI, PI-Rma43812IP, PI-SPBetalP, Pl-Scel, PI-TfuI, PI-TfuII, 
PI-Thyl, PI-Tlil, PI-Tlill. Bevorzugt sind dabei die Homing- 
Endoniikleasen, deren Gensequenzen bereits bekannt sind, wie 
beispielsweise F-Scel, I-Ceul, I-Chul, I-Dmol, I-Cpal, I-Cpall, 
35 I-Crel, I-CsmI, F-TevI, F-Tevll, I-TevI, I-TevII, I-Anil, I-Cvul, 
I-Llal, I-NanI, I-MsoI, I-NitI, I-Njal, I-PakI, I-Porl, I-Ppol, 
I-Scal, I-Ssp6803I, Pl-Pkol, Pl-PkoII, PI-PspI, PI-TfuI, PI-Tlil. 

Ganz besonders bevorzugt sind 

40 

I-Ceul (Cote MJ und Turmel M (1995) Curr Genet 27:177-183.; 
Gauthier A et al. (1991) Curr Genet 19:43-47; Marshall (1991) 
Gene 104:241-245; GenBank Acc.-No.: Z17234 Nukleotide 5102 
bis 5758) , 
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I-Chul (Cote V et al.(1993) Gene 129:69-76; GenBank Acc. -No.: 
1.06107, Nukleotide 419 bis 1075), 

I-Cmoel (Drouin M et al. (2000) Nucl Acids Res 28:4566- 
4572) , 

I-Cpal aus Chlamydomonas pallidostigmatica (GenBank Acc. -No. : 
L36830, Nukleotide 357 bis 815; Turmel M et al. (1995) 
Nucleic Acids Res 23:2519-2525; Tunnel, M et al. (1995) 
Mol Biol Evol 12:533-545) 

I-Cpall (Turmel M et al. (1995) Mol Biol Evol 12:533-545; 
GenBank ACC. -NO.: L39865, Nukleotide 719 bis 1423). 

I-Crel (Wang J et al . (1997) Nucleic Acids Res 25: 3767-3776; 
Diirrenberger. F und Rochaix JD (1991) EMBO J 10:3495-3501; 
GenBank Acc. -No.: X01977. Nukleotide 571 bis 1062), 

- I-Csmi (Ma DP et al. (1992) Plant Mol Biol 18:1001-1004) 

I-NanI (Elde M et al. (1999) Eur J Biochem. 259:281-288; 
GenBank Acc. -No.: X78280. Nukleotide 418 bis 1155). 

_ I-NitI (GenBank Acc. -No. : X78277, Nukleotide 426 bis 1163), 

- I-Njal (GenBank Acc. -No.: X78279, Nukleotide 416 bis 1153), 

- I-Ppol (Muscarella DE mxd Vogt VM (1989) Cell 56:443-454; 
Lin J und vogt VM (1998) Mol Cell Biol 18:5809-5817; GenBank 
Acc. -No.: M38131, Nukleotide 86 bis 577), 

- I-Pspl (GenBank Acc. -No. : U00707, Nukleotide 1839 bis 3449), 

I-Scal (Monteilhet C et al. (2000) Nucleic Acids Res 28: 
1245-1251; GenBank Acc. -No.: X95974, Nukleotide 55 bis 465) 

I-Scel (WO 96/14408; US 5,962,327 dort Seg ID NO: 1), 

- Endo Scel (Kawasaki et al. (1991) J Biol Chem 266:5342-5347, 
identisch zu F-Scel; GenBank Acc. -No.: M63839, Nukleotide 
159 bis 1589) , 

I-Scell (Sarguiel B et al. (1990) Nucleic Acids Res 
18:5659-5665) . 
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I-Scelll (Sarguiel B et al. (1991) Mol Gen Genet. 
255:340-341) , 

I-SSP6803I (GenBank Acc . -No . : D64003, Nukleotide 35372 bis 
5 35824), 

I-TevI (Chu et al. (1990) Proc Natl Acad Sci USA 
87:3574-3578; Bell-Pedersen et al. (1990) Nucleic Acids 
Resl8: 3763-3770; GenBank Acc. -No.: AF158101, Nukleotide 
10 144431 bis 143694) , 

I-TevII (Bell-Pedersen et al. (1990) Nucleic Acids Res 
18: 3763-3770; GenBank Acc. -No.: AF158101, Nukleotide 45612 



15 



bis 44836) , 

I-TevIII (Eddy et al. (1991) Genes Dev. 5:1032-1041), 



Ganz besonders bevorzugt sind kommerziell erhSltliche Homing- 
Endonukleasen wie I-Ceul, I-Scel, I-Ppol, PI-Pspl oder Pl-Scel. 

20 Am meisten bevorzugt sind I-Scel und I-PpoI . Wahrend das Gen 

kodierend fiir I-PpoI in der nattirlichen Form genutzt werden kann, 
besitzt das Gen kodierend fiix I-Scel eine Editierstelle. Da die 
entsprechende Editierung in hSherer Pflanzen im Unterschied zu 
den Mitochondrien der Hefe nicht durchgef iihrt wird, muss eine 

25 kiinstliche das I-Scel Protein kodierende Sequenz zur hetero- 

logen Expression dieses Enzyms eingesetzt werden (US 5,866,361). 

Die Enzyme konnen in der dem Fachmann gelauf igen Art und Weise 
aus ihren Herkunf tsorganismen aufgereinigt und/oder die fiir sie 
30 kodierende Nukleinsaiaresequenz kloniert werden. Die Sequenzen 
verschiedener Enzyme sind in der GenBank hinterlegt (s.o.). 

Als kOnstliche DSBI-Enzyme seien beispielhaft chimare Nukleasen 
zu nennen, die sich aus einer \inspezif ischen NukleasedomSne und 

35 einer sequenzspezif ischen DNA-Bindungsdomane (z.B. bestehend aus 
Zinkfingern) zusammensetzen (Smith J et al. (2000) Nucl Acids 
Res 28(17) :3361-3369; Bibikova M et al. (2001) Mol Cell Biol. 
21:289-297). So wurde beispielsweise die katalytische Domane 
der Restriktionsendonuklease Fokl an zinkf ingerbinde-DomSnen 

40 fusioniert, wodurch die Spezifitat der Bndonuklease definiert 
wurde ( Chandrasegaran S & Smith J (1999) Biol Chem 380:841-848; 
Kim YG & Chandrasegaran S (1994) Proc Natl Acad Sci USA 
91:883-887; Kim YG et al. (1996) Proc Natl Acad Sci USA 
93:1156-1160). Auch die katalytische Domane der Ho-Endonuklease 

45 aus Hefe konnte bereits mit der beschriebenen Technik eine vor- 
definierte Spezifitat verliehen werden, indem diese an die Zink- 
fingerdomane von Trans )criptionsfaktor en ftjsioniert wurde (Nahon E 
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Raveh D (1998) Nucl Acids Ref 26:1233-1239). Durch geeignete 
Mutilans- und Selektionsverf al^en kann man bestehende Hoxnxng- 
Endonukleasen an jede gewOnschte Erkennungssequenz anpassen. 

5 Wie erwahnt, eignen sich insbesondere Zinkf ingerproteine als 
Si-BindungsdornMne i. Kal^en von cbi^ren N^^^--- l^tlZ^l^ 
bindenden Zinkf ingerdomanen kbnnen an ^ede ^-^^-^^J^ ^^Z"'^""" 
angepasst warden. Entsprechende Verfahren zur Herstell^ 
enLprechender Zinkf ingerdomMnen sind beschrxeben und dem 

10 ?^ch^ann bekannt (Beerli RK et al. (2000) Proc Natl Acad 
_ ,.v..,.o._i^nn. R^e-rli RR et al. (2000) J Biol Chem 



975 <42 32617-32627; Segal DJ and Barbas CF 3rd. (2000) Curr 
Opil che^ Bill 4(1) ;34-39; Kang .S and Ki. .S (2000) - Biol Cb^ 
275(12) -8742-8748; Beerli RR et al . (1998) Proc Natl Acad Sex US. 
15 95(25r-ir628-1463;; Kim JS et al. (1997) Proc Natl Acad Sex USA 



94 8) 3616- 620; A (1999) a Mol Biol (2) : 215-218; Tsai 

SY et al. (1998) Adv Drug Deliv Rev 30 (1-3) :23-31; Mapp AK et al. 
f^OOO^ Proc Natl Acad Sci USA 97 (8) : 3930-3935 ; Sharrocks AD 
It al a997T1nt J Biochem Cell Biol 29 (12) : 1371-1387 ; Zbang L 
20 et fl. 2000) J Biol Cbem 275 (43) : 33850-33860) . Verfahren zur 

Herstellung und Selektion von ^^'^'^^^^''^-^^^T^ZZT 
ndt hoher Sequenzspezif itat sind beschrxeben (WO 9^/06166 
WO 98/53059, WO 98/53057). Durch Fusion einer so erhaltenen 
DNA-Blndedomane an die katalytische Dom^e einer Endonuklease 
25 (Wie beispielsweise der Fokl oder Ho-Endonuklease) kann man 
cbUre N^easen mit jeder beliebigen Spezifitat herstellen 
di^als DSBI-Enzyme im Rahmen der vorliegenden Erfxndung vortexl- 
haft eingesetzt werden k5nnen. 

30 Ktostliche DSBI-Enzyme mit veranderter Sequenzspezif itat konnen 
a^f dirch Mutagenese bereits bekannter ^-^^i^^t^^^"™ 
Oder Homing Endonuklaasen durch dem Fachmann l^^^^^l^^^lt 
erzeugt werden. Insbesondere von Interesse xst neben -^^r ^uta 
genese von Homing-Endonukleasen mit dem Ziel, exne veranderte 

35 substratspezifitat zu erzielen, auch die Mutagenese von Matu- 
rSen Ma?urasen haben haufig viele Gemeinsamkeiten mxt Homxng- 
Endonukleasen und lassen sich durch wenige ^-^^^i^"^':^/^;^;^^ 
Nukleasen umwandeln. Dies wurde beispielswexse fur dxe Maturase 
^ bl2 "tron der BSckerhefe gezeigt. Lediglich zwei Mutatxonen 

40 Z Se Maturase kodierenden offenen Leseraster (ORF) rexchten 

ius^esem Enzym eine Homing-Endonuklease Aktivitat zu verlexhen 
(Szczepanek & Lazowska (1996) EMBO J 15:3758-3767). 

Weitere kiinstliche Nukleasen konnen mit Hilfe . 
45 introns und den von ihnen kodierten Proteinen oder Texle dxeser 
Proteine erzeugt werden. Mobile Gruppe II Introns bxlden mxt 
den von ihnen kodierten Proteinen RNA-Protein-Partxkel . dxe 
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sequenzspezif isch DNA erkennen \md schneiden konnen. Die Sequenz- 
spezifitat kann dabei durch Mutagenese von bestimmten Bereichen 
des Introns (siehe xinten) den Bedarfnissen angepasst werden 
(WO 97/10362) . 

5 

Bevorzugt wird das DSBI-Enzym als Fusionsprotein mit einer Kem- 
lokalisationssequenz (NLS) exprimiert. Diese NLS-Sequenz ermOg- 
licht einen erleichterten Transport in den Kern imd steigert die 
Effizienz des Rekoinbinationssysteins . Verschiedene NLS-Sequenz en 
10 sind dem Pachmann bekajint und unter anderem beschrieben bei 

Jicks GR und Raikhel NV (1995) Annu. Rev. Cell Biol. 11:155-188. 
Bevorzugt ftir pflanzliche Organismen ist beispielsweise die NLS- 
Sequenz des SV40 "large antigen'. Ganz besonders bevorzugt sind 
die nachfolgenden NLS-Sequenzen: 

15 

NLSl : N-Pro-Lys-Thr-Lys-Arg-Lys-Val-C 

NLS2 : N-Pro-Lys-Lys-Lys-Arg-Lys-Val-C 

20 Aufgrund der geringen GrolSe vieler DSBI-Enzyme (wie beispiels- 
weise der Homing-Endonukleasen) ist jedoch eine NLS-Sequenz 
nicht zwingend erf orderlich. Diese Enzyme kSnnen die Kemporen 
auch ohne die Unterstxitzung passieren. 

25 "^Erkennungssequenz zur gezielten Induktion von DNA-Doppel- 
strangbriichen* meint allgemein solche Secpienzen, die unter 
den Bedingungen in der jeweils verwendeten eukaryotischen 
Zelle Oder Organismus die Erkennung und Spaltung durch das 
DSBI-Enzym erlauben. Beispielhaft aber nicht einschrSnkend 

30 seien dabei in nachf olgender Tabelle 1 die Erkennungsseqpienzen 
fur die jeweiligen aufgefiihrten DSBI-Enzyme genannt. 

Tabelle 1: Erkennungssequenzen und Herk\xnf tsorganismus von DSBI- 
Enzymen ("-^^ gibt innerhalb einer Erkennungssequenz 
35 die Schnittstelle des DSBI-Enzyms an) 



45 



DSBI-Enzym 


Herkunf ts- 
organismus 


Erkennungssequenz 


CRE 


Bacteriophage 
PI 


5 ' -AACTCTCATCGCTTCGGATAACTTCCTGTTATCCGAAACAT 
ATCACTCACTTTGGTGATTTCACCGTAACTGTCTATGATTAATG 
-3' 


FLP 


S ac char omy c e s 
cerevisiae 


5 ' -GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGAAAGTA- 
TAGGAACTTC-3 ' 


R 


pSRl 
Plasmids 


5 ' -cgagatcatatcactgtggacgttgatgaaaqaatacgtta 
ttctttcatcaaatcgt 


P-Element 

Transpo- 

sase 


Drosophila 


5 ' -ctagatgaaataacataaggtgg 
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DSBI-Enzym 


Herkunf ts- 
organismus 


i**rKezin.uiiy ss etjutsix^ 




I -Anil 


Aspergillus 
nidulcuis 


5 ' -TTGAGGAGGTT'^TCTCTGTAAATAANISn^NlSn:^^ 
3 ' -AACTCCTCCAAAGAGACATTTATTNISINI^^ 


5 


I-Ddil 


Dictyos tel ium 
di scoideuinAX3 


5 ' -TTTTTTGGTCATCCAGAAGTATAT 
3 ' -AAAAAACCACTAGGTCTTCATATA 




I— Cvul 


Clilorella 
vulgsiris 


5 ' -CTGGGTTCAAAACGTCGTGA'^GACAGTTTGG 
3 ' -GACCCAAGTTTTGCAG''CACTCTGTCAAACC 




I-Csitil 


Ch.1 amydomonas 
smithii 


5 — GTACTAGCATGGC3VjiC~AAft.iijlv-.i x i\-iA3Va 


10 


I-Cmoel 


Chlainydomo- 
nasmoevms i 1 


5 ' -TCGTAGCAGCT'^CACGGTT 
3 ' -AGCATCCTCGAGTGCCAA 




I-Crel 


Ch.1 amydomonas 
reinhardtii 


5 ' -CTGGGTTCAAAACGTCGTGA'^GACAGTTTGG 
3 ' -GACCCAAGTTTTGCAG'^CACTCTGTCAAACC 


IS 


I-Ctiul 


Ch lainydoitionas 
hiomicola 


3 ' -CTTCCAAACCGTCGAGCTACAGCCGAGTAG 




I-Cpal 


Ciilainydoiiionas 

pallidostig- 

matica 


3 ' -GCTAGGATTCCATC'^GCTTTAAGT 


20 


I-Cpall 


Cli 1 amy domon a s 

pallidostig- 

matica 


3 ' -GGGCCGAT'^TGAGACACGGTC 


I-Ceul 


Chlamydomonas 
eugamet.os 


5 ' -CGTAACTATAACGGTCCTAA'^GGTAGCGAA 

f — nnA'PTX^ATATTGCCAG'^GATTCCATCGCTT 




I-Dmol 


Desul f urococ - 
cus mobilis 


5 ' -ATGCCTTGCCGGGTAA'^GTTCCGGCGCGCAT 
/ — TiAr'rinAAPCM^C'^nATTCAAGGCCGCGCGTA 


25 


I-Scel 


S . cerevisiae 


c / Ts./^n^n^Ar'rv^T^Ari/'^riATA A'^P ArJCM^TrAATATAG 
3 ' -TCAATGCGATCCCTATTGTCCCATTATATC 
5 ' -TAGGGATAA'^CAGGGTAAT 

3 ' -ATCCCTATTGTCCCATTA ( " Core " -Sequenz ) 


30 


I-Scell 


S . cerevisiae 


5 ' -TTTTGATTCTTTGGTCACCCTGAAGTATA 
3 ' -AAAACTAAGAAACCAG'^TGGGACTTCATAT 


I-Scelll 


S - cerevisiae 


5 ' -ATTGGAGGTTTTGGTAAC'^TATTTATTACC 
3 ' -TAACCTCCAAAACC^ATTGATAAATAATGG 




I-ScelV 


S . cerevisiae 


5 ' -TCTTTTCTCTTGATTA'^GCCCTAATCTACG 
3 ' -AGAAAAGAGAAC^TAATCGGGATTAGATGC 


35 


I-SceV 


S .cerevisiae 


5 ' -AATAATTTTCT^TCTTAGTAATGCC 
3 ' -TTATTAAAAGAAGAATCATTA'^CGG 




I-SceVI 


S . cerevisiae 


5 ' -GTTATTTAATCTTTTAGTAGTTGG 
3 ' -CAATAAATTACAAAATCATCA'^ACC 




I-SceVII 


S .cerevisiae 


5 ' -TCTCACATTGAGGTGCACTAGTTATTAC 




Pl-Scel 


S . cerevisiae 


5 ' -ATCTATGTCGGGTGC^GGAGAAAGAGGTAAT 
3 ' -TAGATACAGCC'^CACGCCTCTTTCTCCATTA 


40 


F-Scel 


S. cerevisiae 


5 ' -GATGCTGTAGGCATAGGCTTGGTT 
3 ' -CTACGACA'^TCCGTATCCGAACCAA 




F-Scell 


S. cerevisiae 


5 ' -CTTTCCGCAACA'^GTAAAATT 
3 ' -GAAAGGCG'^TTGTCATTTTAA 


45 


I-Hmul 


Bacillus sub- 
tilis bacte- 
riophage SPOl 


5 ' -ACTAATGAGCCTAACGCTCAGCAA 
3 ' -TCATTACTCGGATTGC'GACTCGTT 
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DSBI— Enzyin 


Herkunf ts- 
organismus 


Er k ennun g s s e Cfu en 2 


5 


I-HitvuII 


Bacillus 
subtilis 
bacteriophage 
SP82 


5 ' -AGTAATGAGCCTi^CGCTCAACAANNNNNNNN^^ 
NMNNNNNNNNNNNNNNI^NNNNN 




I-Llal 


Lactococcus 
lactis 


5' 


-CACATCCATAACCATATCATTTTT 




I-Msol 


Monomastix 
species 


5' 


-CTGGGTTCAAAACGTCGTGA'^GACAOTTTGG 

'VaA^Vtf V-JUVva X 1 1 1\3VJA^ IJa^ 1 ^ XAmaAaI^V.. 


10 


I-NanI 


Naegleria an- 
dersoni 


5' 


-AAGTCTGGTGCCA'^GCACCCGC 




I-NitI 


Naegleria 
italica 


5' 


-AAGTCTGGTGCCA'^GCACCCGC 


15 


I-Njal 


Naegleria ja- 
miesoni 


5' 


-AAGTCTGGTGCCA'^GCACCCGC 


I-PakI 


Ps eudendoclo - 

niiiiti akinetuan 


S' 

*a # 


-CTGGGTTCAAAACC?rCGTGA'"GACAGTTTGG 

— GACCCAAGTTTTGCAvj CACTCTGTCAAACC 




I-Porl 


Pyrobaculiom 
o r gan o t r op hum 


5' 

3' 


-GCGAGCCCGTAAGGGT'^GTGTACGGG 
-CGCTCGGGC?ITT ''CCCACAC ATGCCC 


20 


I-Ppol 


Physarum po- 
lycephalum 


5' 
3' 


-TAACTATGACTCTCTTAA^GGTAGCCAAAT 
-ATTGATACTGAGAC^AATTCCATCGGTrTA 




I-Scal 


Sac char oniyc es 
capensis 


5' 
3' 


-TGTCACATTGAGGTGCACT'^AGTTATTAC 
-ACAGTGTAACTCCAC^GTGATCAATAATG 




I-Ssp6803I 


Syn echo cyst is 
species 


5' 
3 ' 


-GTCGGGCT'^CATAACCCGAA 

-CAGCCCGAGTA^TTGGGCTT 


25 


Pl-Pful 


Pyrococcus 
furiosus Vcl 


5' 
3' 


-GAAGATGGGAGGAGGG^ACCGGACTCAACTT 
-CTTCTACCCTCC^TCCCTGGCCTGAGTTGAA 




PI~PfulI 


Pyrococcus 
furiosus Vcl 


5' 
3' 


-ACGAATCCATGTGGAGA'^AGAGCCTCTATA 
-TGCOTAGGTACAC^CTCTTCTCGGAGATAT 


30 


Pl-Pkol 


Pyrococcus 
kodakar aens i s 
KODl 


5' 
3 ' 


-GATTTTAGAT'^CCCTGTACC 
-CTAAAA'^TCTAGGGACATGG 




Pl-PkoII 


Pyrococcus 
ko dakar aens i s 
KODl 


5' 
3' 


-CAGTACTACCGTTAC 
-GTCATCATGCCAATG 




Pi-Pspl 


Pyrococcus 
sp. 


5' 
3' 


-AAAATCCTGGCAAACAGCTATTAT'^GGGTAT 
-TTTTAGGACCGTTTGTCGAT'^AATACCCATA 


35 


PI-TfuI 


Thermococcus 

fuitdcolans 

ST557 


5' 
3 ' 


-TAGATTTTAGGT'^CGCTATATCCTTCC 
- ATCTAAAA^ TCCAGCGATATAGGAAGG 


40 


PI-TfuII 


Thermococcus 

fumicolans 

ST557 


5' 
3' 


-TAYGCNGAYACN'^GACGGYTTyT 
-ATRCGNCT'^RTGNCTGCCRAARA 


PI-Thyl 


Thermococcus 
hydro therma- 
lis 


5' 
3' 


-TAYGCNGAYACN'^GACGGYTTYT 
-ATRCGNCT'^RTONCTGCCRAARA 




PI-Tlil 


Thermococcus 
literal is 


5' 
3' 


-TAYGCNGAYACNGACGCYTTYT 
-ATRC6NCTRTGNCTGCCRAARA 


45 


PI-Tlill 


Thermococcus 
litoralis 


5' 


-AAATTGCTTGCAAACAGCTATTACGGCTAT 




I-Tevi 


Bacteriophage 
T4 


5' 
3' 


-AGTGGTATCAAC'GCTCAGTAGATG 
-TCACCATAGT'^TGCGAGTCATCTAC 



wo 2004/013333 PCT/EP2003/007877 

43 



5 



DSBI-Enzym 


Herkunf ts- 
organismus 


Erkennungssequenz 


I-TevII 


Bacteriophage 
T4 


5 ' -GCTTATGAGTATGAAGTGAACACGT'^TATTC 
3 ' -CGAATACTCATACTTCACTTGTG'^CAATAAG 


F-TevI 


Bacteriophage 
T4 


5 ' -GAAACAaVAGA''AATGTTTAGTAAA3SINNNN^^ 
3 ' -CTTTGTGTTCTTTACAAATCATTTNNNlsnSI^^ 


P-TevII 


Bacteriophage 
T4 


5 ' -TTTAATCCTCGCTTC'^AGATATGGCAACTG 
3 ' -AAATTAGGAGCGA''AGTCTATACCGTTGAC 



Xo Dabei sind auch kleinere Abweichiingen (Degenerationen) der 
Erkennungssequenz vimfasst, die dennoch eine Erkeimving und 
Spaltiixig durch das jeweilige DSBI-Enzym erm5glicheii. Derartige 
Abweichungen - auch in Zusammenhang mit xinterschiedlichen 
Rahmenbedingxingen wie beispielsweise Calcium oder Magnesium- 

15 Konzentration - sind beschrieben {Argast GM et al. (1998) J Mol 
Biol 280:345-353). Ferner sind Kemsequenzen ( *'Core''-Sequenzen) 
dieser Erkennungssequenzen imfasst. Es ist bekannt, dass auch die 
inneren Anteile der Erkennungssequenzen fur einen induzierten 
Doppelstrangbruch genugen und das die auSeren nicht vmbedingt 

20 relevant sind, jedoch die Effizienz der Spaltung mitbestimmen 
konnen. So kann beispielsweise fiir I-Scel eine 
18bp-"Core"-Sequenz definiert werden. 



25 



Besagte DSBI -Erkennungssequenzen konnen an verschiedenen 
Posit ionen in oder in der Nahe eines Markerprotein-Gens lokali- 
siert werden und konnen - beispielsweise bei der Verwendung eines 
Transgens als Markerproteins - bereits bei der Konstruktion der 
Markerprotein-Expressionskassette eingebaut werden. Verschiedene 
MSglichkeiten der Lokalisation sind beispielhaft in den Fig. 2-A, 
30 2-B, 3 und 5 sowie in den Beschreibungen dazu verdeutlicht . 

In einer weiteren vorteilhaf ten Ausfiihrungsf orm umfasst die 
Insertionssequenz mindestens eine Homologies equenz A, die eine 
ausreichende Lange und eine ausreichende Homologie zu einer 

35 Sequenz A' in dem IStorkerproteingen aufweist, um eine homologe 
Rekombination zwischen A und A' zu gewShrleisten. Bevorzugt 
ist Insertionssequenz von zwei Sequenzen A und B flankiert, die 
eine ausreichende Lange und eine ausreichende Homologie zu einer 
Sequenz A' bzw. B' in dem Markerproteingen aufweisen, um eine 

40 homologe Rekombination zwischen A und A' bzw. B und B' zu gewShr- 
leisten. 

^Ausreichende LSnge" meint in Bezug auf die Homologiesequenzen A, 
A' und B, B' bevorzugt Secjuenzen von einer Lange von mindestens 
45 100 Basenpaaren, bevorzugt mindestens 250 Basenpaaren, besonders 
bevorzugt von mindestens 500 Basenpaaren, ganz besonders bevor- 
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zugt von mindestens 1000 Basenpaaren, am meistens bevorzugt von 
mindestens 2500 Basenpaaren. 

"Ausreichende Homologie" meint in Bezug auf die Homologie- 
5 sequenzen, bevorzugt Sequenzen die eine Homologie zueinander 
aufweisen von mindestens 70 bevorzugt 80 %, vorzugsweise min- 
destens 90 %, besonders bevorzugt mindestens 95 %, ganz besonders 
bevorzugt mindestens 99 %, am meisten bevorzugt 100% liber eine 
Lange von von mindestens 20 Basenpaaren, bevorzugt mindestens 
10 50 Basenpaaxen, besonders bevorzugt von mindestens 100 Basen- 
paaren, ganz besonders bevorzugt von mindestens 250 Basenpaaren, 
am meisten bevorzugt von mindestens 500 Basenpaaren. 

Unter Homologie zwischen zwei Nukleinsauren wird die Identit^t 
15 der Nukleinsauresequenz viber die jeweils gesamte Sequenz lange 

verstanden, die durch Vergleich mit Hilfe des Programmalgorithmus 
GAP (Wisconsin Package Version 10.0, University of Wisconsin, 
Genetics Computer Group (GCG) , Madison, USA) unter Einstellung 
folgender Parameter berechnet wird: 

20 

Gap Weight: 12 Length Weight: 4 

Average Match: 2,912 Average Mismatch : -2 , 003 

25 In einer weiteren bevorzugten Ausfiihrungsf orm wird die Effizienz 
der Rekombination gesteigert durch Kombination mit Verfahren, 
die die homologe Rekombination fordem. Solche Verfahren sind be- 
schrieben und umfassen beispielhaft die Expression von Proteinen 
wie RecA oder die Behandlung mit PARP-Inhibitoren. Es konnte 

30 gezeigt werden, dass die intrachromosomale homologe Rekombination 
in Tabalcpf lajizen durch die Verwendung von PARP- Inhibit or en erhoht 
werden kann (Puchta H et al . (1995) Plant J 7:203-210). Durch 
den Einsatz dieser Inhibitoren kauin die Rate der homologen 
Rekombination in den Rekombinationskonstrukten nach Induktion 

35 des sequenzspezif ischen DNA-Doppelstrangbruches und damit die 
Effizienz der Deletion der Trcinsgensequenzen weiter erhoht 
werden. Verschiedene PARP Inhibitoren kSnnen deJDei zum Einsatz 
kommen. Bevorzugt umfasst sind Inhibitoren wie 3-Aminobenzamid, 
8-Hydroxy-2-methylc[uinazolin-4-on (NU1025 ) , 1 , llb-Dihydro- 

40 [2H]benzopyranot4,3,2-de]isoquinolin-3-on (GPI 6150), 5-Amino- 
isoquinolinon, 3 , 4-Dihydro-5- [4- { 1-piperidinyl ) butoxy] -1 ( 2H) - 
isocjuinolinon oder die in WO 00/26192, WO 00/29384, WO 00/32579, 
WO 00/64878, WO 00/68206, WO 00/67734, WO 01/23386 und 
WO 01/23390 beschriebenen Substanzen. 

45 

Weitere geeignete Methoden sind die Einfiihrung von Nonsense- 
Mutationen in endogene Markerprotein Gene ziom Beispiel mittels 
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Einfuhrung von RNA/DNA-Oligonukleotiden in die Pflanze (Zhu 
et al. (2?00) Nat Biotechnol 18 (5) : 555-558) . Punktmutatxonen 
kCnnen auch mittels DNA-RNA Hybridan erzeugt warden '^H^f' 
als "chimeraplasty bakannt sind (Cole-Strauss at ' < ^^^9 ) Nucl 
5 Lids Res 27(5):1323-1330; Kndec (1999) Gene therapy Amerxcan 
Scientist 87 (3) : 240-247) . 



10 



Die Methoden dar dsBNAi, der Kosupprassion mittels sense-RNA 
Zl dL "VIGS" ("Virus induced gene silencing-) --"^^s 
^ost-transcriptional gene silencing-* (PTGS) bezexchnat. PTGS- 
Verfah^en Bind basondars vortailbaft, weil die Anf orderungen an 
Ite H^ologie zwischen dam zu vermindemden Markerprotexn-Gen und 
11 t^sgL expri^erten sense- oder 

aeringer sind als beispielsweise bei ainem klassischen antxsense 
I^sitz so kann man untar Varwendung der Markarprotein-Nuklexn- 

" ^uJesec^enzen aus einar Art aucb die Expression von homologen 
S^ke^J^tein-Proteinen in anderen Arten effaktiv vermxndem. 
S^f ^ss die isoliarung und Strukturaufklarung der dort vor- 
k— ;nSn Markerprotain-Homologan zwingend erforderlxcb ware. 

20 Dies arleichtert erheblich den Arbeitsaufwand. 

"Einbringan" umfasst im Rahmen dar Krfindung alle Verfahren dia 
dazf gaa?gnat aine »anti-Markerprotain"-Verbindung, dxrekt oder 
tlZAll ±n aine Pflanze oder eine Zelle, Kompartiment , Gewebe, 
Orgi^ Oder Saxnen derselben . einzuf Ohran odar dort zu ganarxeran. 

" S;S^te "d indirakta Varfabran sind umfasst. Bas Einbrxngan 
kann zu einar vorObargahandan (transienten) ^-^^^^^ ^^^^^ 
«anti-Markerprotein'-Verbindung (beispxelswexse ^^^^^^^^ 
Oder einer Rekombinase) fOhren oder aber auch zu exnar dauar- 

30 haften (stabilen) . 

Gemafi der unterschiadlichen Natur der oben baschriabanan Ansatze 
die -"anti-Markarprotain-Varbindung ihra Funktion dxrekt 

^ tlsZ^ durch insertion in exn andogenas Markerprotexn Gen) 
33 i:^en. Die Funktion kann aber auch indirekt nach ^-^^^P^^^ 
" in eine RNA (zum Beispiel bei antisansa AnsStzan) odar nach 

iranskription und Translation in ein ^-^-^ 

Rekombinasen oder DSBI-Bnzymen) ausgetibt werden. ^owohl dxrekte 
als auch indirekt wirkende «anti-Markerprotein'-Verbxndungen 
40 sind erf indungsgemSiS umfasst. 

EinfOhren umfasst beispielsweise Verfahren wie Transf ektion, 
Transduktion oder Transformation. 

^5 »Anti-Markerprotain- Varbindungan umfasst somit ^^^^^^f 
weise auch Expressionskassetten, die eine Expressxon (d h. 
Transkription und ggf . Translation) beispielswexse exner 
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MP~dsRNA, einer MP-antisenseRNA, einer sequenzspezif ischen 
Rekombinase oder eines DSBI-Enzyms in einer pflanzlichen Zelle 
realisieren kSnnen. 

5 ^^Expressionskassette" meint im Rahmen dieser Erfindung allgemein 
solche Konstruktionen in denen eine zu exprimierende Nuklein- 
sauresequenz in f unktioneller Verkntipfiing mit mindestens einer 
genetischen Kontrollsequenz - bevorzugt einer Promotorsequenz - 
steht. Expressionskassetten bestehen bevorzugt aus doppel- 
10 strangiger DMA \md kSnnen eine lineare oder zirkulSre Struktur 
haben . 

Unter einer funktionellen Verkntipfung versteht man zum Bei- 
spiel die sequentielle Anordnimg eines Promotors mit einer zu 

15 transkribierenden Nukleinsauresequenz (beispielsweise kodierend 
fiir eines MP-dsRNA oder ein DSBI-Enzym) und ggf . weiterer regu- 
lativer Elemente wie zum Beispiel einem Terminator \and/oder Poly- 
adenylierungssignalen derart, dass jedes der regulativen Elemente 
seine Funktion bei der Transkription der Nukleinsauresequenz, je 

20 nach Anordnung der Nukleinsauresequenz en erfullen kann. Fxinktion 
kann dabei beispielsweise die Kontrolle der Expression d.h. 
Transkription und/oder Translation der Nukleinsauresequenz (bei- 
spielsweise kodierend f\ir eine MP-dsRNA oder ein DSBI-Enzym) 
bedeuten. Kontrolle xamfasst dabei beispielsweise das Initiieren, 

25 Steigerung, Steuerring oder Suppression der Expression d,h. Tran- 
skription und ggf. Translation. Dazu ist nicht unbedingt eine 
direkte Verkniipfung im chemischen Sinne erf orderlich. Genetische 
Kontrollsequenzen, wie zum Beispiel Enhancer-Sequenzen, kdnnen 
ibre Funktion auch von weiter entfemten Positionen oder gar von 

30 anderen DNA-Molekaien aus auf die Zielsequenz ausiiben. Bevorzugt 
sind Anordnungen, in denen die zu transkribierende Nukleinsaure- 
sequenz hinter der als Promoter fungierenden Sequenz positioniert 
wird, so dass beide Sequenzen kovalent miteinajider verbxinden 
sind. Bevorzugt ist dabei der Abstand zwischen der Promotorse- 

35 quenz und der transgen zu exprimierende Nukleinsauresequenz 
geringer als 200 Basenpaare, besonders bevorzugt kleiner als 
100 Basenpaare, ganz besonders bevorzugt kleiner als 50 Basen- 
paare . 

40 Dem Fachmann sind verschiedene Wege bekannt, um zu einer der 
erf indungsgemSssen Express ionskassette zu gelangen. Die Her- 
stellung einer erf indungsgemassen Expressionskassette erfolgt 
beispielsweise bevorzugt durch direkte Fusion einer als Promoter 
fungierenden Nukleinsauresequenz mit einer zu exprimierenden 

45 Nukleotidsequenz (beispielsweise kodierend fiir eines MP-dsRNA 
Oder ein DSBI-Enzym) . Die Herstellung einer funktionellen Ver- 
knxipfung kann mittels gangiger Rekombinations- tmd Klonierimgs- 
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techniken realisiert werden, wie sie beispielsweise in Maniatis 
T, Fritsch EF und Sambrook J (1989) Molecular Cloning: A Labora- 
tory Itonual, Cold Spring Harbor Laboratory, Cold Spring Harbor, 
NY sowie in Silhavy TJ et al. (1984) Experiments with Gene 
5 Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY 
und in Ausubel FM et al. (1987) Current Protocols in Molecular 
Biology, Greene Publishing Assoc . and Wiley Interscience 
beschrieben sind. 

10 Vorzugsweise umfassen die erf indungsgemMssen Expressionskassetten 
S'-stromaufwarts von der jeweiligen transgen zu exprimierenden 
Nukleinsaureseciuenz einen Promoter land 3 ' -stromabwarts eine Ter- 
minator sequenz als zusatzliche genetische Kont roll sequenz, sowie 
gegebenenfalls weitere iibliche regulative Elemente, und zwar 

15 jeweils funktionell verknupft mit der transgen zu exprimierenden 
Nukleinsauresequenz . 

Der Begrif f der ^^genetischen Kontrollsequenzen'' ist breit zu 
verstehen und meint all solche Sequenzen, die einen Einfluss 

20 auf das Zustandekommen oder die Funktion der erf indungsgemMssen 
Expressionskassette haben. Genetische Kontrollsequenzen gewahr- 
leisten zum Beispiel die Transkription und gegebenenfalls 
Translation in prokaryotischen oder eukaryotischen Organismen. 
Genetische Kontrollsequenzen sind beispielsweise beschrieben bei 

2S ^Goeddel; Gene Expression Technology: Methods in Enzymology 185, 
Academic Press, San Diego, CA (1990)" oder -Gruber and Crosby, 
in: Methods in Plant Molecular Biology and Biotechnolgy , CRC 
Press, Boca Raton, Florida, eds.iGlick and Thompson, Chapter 7, 
89-108" sowie den dort auf gewiesenen Zitaten. 

30 

Genetische Kontrollsequenzen umfassen insbesondere in Pflanzen 
funktionelle Promotoren. Als bevorzugte Promotoren fiir die 
Expressionskassetten ist grundsatzlich jeder Promoter geeignet, 
der die Expression von Genen, insbesondere Fremdgenen, in 
35 Pflanzen steuem kann. 

Pflanzenspezifische oder in Pflanzen bzw. pflanzlichen Zelle 
funktionelle Promotoren meint grundsatzlich jeden Promoter, der 
die Expression von Genen, insbesondere Fremdgenen, in mindestens 
40 einer Pflanze oder einem Pf lanzenteil , -zelle, -gewebe, -kultur 
steuem kann. Dabei kann die Expression beispielsweise konstitu- 
tiv, induzierbar oder entwicklungsabhangig sein, Bevorzugt sind: 



45 
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a) Konstitutive Promo tor en 
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Konstitutive" Promotoren meint solche Promotoren, die eine 
Expression in zahlreichen, bevorzugt alien, Geweben Ober 
5 einen groSeren Zeitraum der Pf lanzenentwicklxing, bevorzugt 

2u alien Zeitpunkten der Pf lanzenentwicklung, gewahrleisten 
(Benfey et al.(1989) EMBO J 8:2195-2202). Vorzugsweise 
verwendet man insbesondere einen pflanzlichen Promotor oder 
einen Promotor, der einem Pf lanzenvirus entstammt. Ins- 

10 besondere bevorzugt ist der Promotor des 35S-Transkriptes 

des CaMV Bl\amenkohlmosaikvirus (Franck et al . (1980) Cell 
21:285-294; Odell et al . (1985) Nature 313:810-812; Shewmaker 
et al. (1985) Virology 140:281-288; Gardner et al. (1986) 
Plant Mol Biol 6:221- 228) oder der 19S CaMV Promotor 

15 (US 5,352,605; WO 84/02913; Benfey et al. (1989) EMBO J 

8:2195-2202) sowie der Promotor des Nitrilase-1 Gens aus 
Arabidopsis thaliana (GenBank Acc.-No. : YQ7648. Nukleotide 
2456 (altemativ 2861) bis 4308 oder altemativ 4340 oder 
4344. (beispielsweise bp 2456 bis 4340). 

20 

Ein weiterer geeigneter konstitutiver Promotor ist der 
«Rubisco small subunit (SSU) "-Promotor (US 4,962,028), der 
LeguminB-Promotor (GenBank Acc.-No.: X03 677) , der Promotor 
der Nopalinsynthase aus Agrobacterium, der TR-Doppelpromotor , 

25 der OCS (Octopin Synthase) Promotor aus Agrobacterium, der 

Ubiquitin Promotor (Holt or f S et al. (1995) Plant Mol Biol 
29:637-649), der Ubiquitin 1 Promotor (Christensen et al . 
(1992) Plant Mol Biol 18:675-689; Bruce et al. (1989) Proc 
Natl Acad Sci USA 86:9692-9696), der Smas Promotor, der 

30 Cinnamylalkoholdehydrogenase-Promotor (US 5,683,439), 

die Promotoren der vakuolarer ATPase Untereinlieiten oder 
der Promotor eines prolinreichen Proteins aus Weizen 
(WO 91/13991) / sowie welter e Promotoren von Genen, deren 
konstitutive Expression in Pflanzen dem Fachmann bekannt ist. 



35 



b) Gewebespezif ische Promotoren 

Bevorzugt sind Promotoren mit Spezifitaten ftir die Antheren, 
Ovarien, Bluten, Blatter, Stengel, Wurzeln oder Samen. 



40 



Samenspezifiscbe Promotoren umfassen zum Beispiel den 
Promotor des Phaseolins (US 5,504,200; Bustos MM et al . 
(1989) Plant Cell 1 (9) : 839-53 ) , des 2S Albumins (Joseff- 
son LG et al . (1987) J Biol Chem 262:12196-12201), des 
45 Legumins (Shirsat A et al. (1989) Mol Gen Genet 215(2): 

326-331)/ des USP (unknown seed protein; Baiimlein H 
et al. (1991) Mol Gen Genet 225 (3) :459-67) , des Napins 
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(US 5,608,152; Stalberg K et al. (1996) L Planta 
199:515-519). des Saccharosebindeproteins (WO 00/26388), 
desLegumins B4 {LeB4; Baumlein H et al. (1991) Mol Gen 
Genet 225: 121-128; Baemalein et al. (1992) Plant Journal 
2(2):233-9; Fiedler U et al. (1995) Biotechnology (NY) 
13(10) :1090f) , des Oleosins (WO 98/45461) oder des Bce4 
(WO 91/13980) . Weitere geeignete samenspezif ische 
Promotoren sind die der Gene kodierend fiir das "High 
Molecular Weight Glutenin- (HMWG) , Gliadin, Verzweigungs- 
enzym, ADP Glucose Pyrophosphatase (AGPase) oder StSrke- 
synthase. Bevorzugt sind femer Promotoren, die eine 
samenspezif ische Expression in Monokotyledonen wie Mais, 
Gerste, Weizen, Roggen, Reis etc. erlauben. Vorteilhaft 
eingesetzt werden kSnnen der Promoter des lpt2- oder 
Iptl-Gens (WO 95/15389, WO 95/23230) oder die Promotoren 
beschrieben in WO 99/16890 (PrCTnotoren des Hordeins, 
Glutelins, Oryzins, Prolamins, Gliadins, Zeins, Kasirins 
Oder Secalins) . Weitere samenspezif ische Promotoren sind 
beschrieben in WO 89/03887. 

Raollen-, Speicherwurzel- oder Wurzel-spezif ische Promo- 
toren umfassen beispielsweise den Patatin Promoter Klasse 
I (B33) Oder den Promoter des Cathepsin D Inhibitors aus 
Kartof f el . 

Blattspezifische Promotoren umfassen beispielsweise 
den Promoter der cytosolischen FBPase aus Kartof fel 
(WO 97/05900), den SSU Promoter (small sxibunit) der 
Rubisce (Ribulose-l,5-bisphosphatcarboxylase) oder den 
ST-LSI Promoter aus Kartof fel (Stockhaus et al. (1989) 
EMBO J 8:2445-2451). 

Bliitenspezifische Promotoren umfassen beispielsweise den 
Phytoen Synthase Promoter (WO 92/16635) oder den Promoter 
des P-rr Gens (WO 98/22593). 

Antheren-spezifische Promotoren umfassen beispielsweise 
den 5126-Premetor (US 5,689,049, US 5,689,051), den 
gleb-1 Promoter und den f-Zexn Promoter . 

c) Chemisch induzierbare Promotoren 

Chemisch induzierbare Promoter erlaxiben es, die Expression 
abhSngig von einem exogenen Stimulus zu steuem (ubersichts- 
artikel: Gatz et al. (1997) Ann Rev Plant Physiol Plant 
Mol Biol 48:89-108). Beispielhaft seien zu nennen: Der PRPl 
Promoter (Ward et al. (1993) Plant Mol Biol 22:361-366), 
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ein durch SalicylsSure induzierbarer Promotor (WO 95/19443) , 
ein durch Benzolsulfonamid- induzierbarer Praniotor 
(EP-A 0 388 186), ein durch Tetrazyklin-induzierbarer 
Promotor (Gatz et al . (1992) Plant J 2:397-404), ein durch 
5 AbscisinsSure induzierbarer Promotor (EP 0 335 528) bzw. 

ein durch Ethanol- oder Cyclohexanon-induzierbarer Promotor 
(WO 93/21334). Femer geeignet ist der Promotor des Gluta- 
thione-S-transf erase Isoform II Gens (GST-II-27), der 
durch exogen applizierte Safener wie z.B. N,N-Diallyl- 
10 2,2-dichloroacetamid aktiviert werden kann (WO 93/01294) 

und in zahlreichen Geweben von sowohl Monokotyledonen als 
auch Dikotyledonen funktionell ist. 

Besonders bevorzugt sind konstitutive oder induzierbare 
15 Promotoren. 

Ferner sind fur die gezielte Ejqsression in den Plastiden 
plastiden-spezifische Promotoren bevorzugt. Geeignete Promotoren 
sind beispielsweise beschrieben in WO 98/55595 oder WO 97/06250. 
20 Zu nennen sind das rpo B Promotorelement, das atoB Promotor- 
element, das clpP Promotorelement (siehe auch WO 99/46394) oder 
das leSrDNA Promotorelement. Weiterhin sind virale Promotoren 
geeignet (WO 95/16783). 

25 Eine gezielte plastidare Expression kann auch erreicht werden, 
wenn man zum Beispiel einen bakteriellen oder Bakteriophagen 
Promotor verwendet, die resultierende Expressionskassette in^ 
die plastidare DNA einbringt und die Expression dann durch ein 
Fusionsprotein aus einer bakteriellen oder Bakteriophagen Poly- 

30 merase und einem plastidaren Transitpeptid exprimiert. Ein ent- 
sprechendes Verfahren ist in US 5,925,806 beschrieben. 

Genetische Kontrollsequenzen umfassen femer auch die 5'-untrans- 
latierte Regionen, Introns oder nichtkodierende 3 '-Region von 

35 Genen wie beispielsweise das Actin-1 Intron, oder die Adhl-S 
Introns 1, 2 xind 6 (allgemein: The Maize Handbook, Chapter 116, 
Freeling and Walbot, Eds., Springer, New York (1994)). Es ist 
gezeigt worden, dass diese eine signifikante Funktionen bei der 
Regulation der Genexpression spielen kSnnen. So wurde gezeigt, 

40 dass 5 ' -untranslatierte Sequenzen die transiente Expression 

heterologer Gene verstarken kdnnen. Sie konnen femer die Gewebs- 
spezifitat fSrdern (Rouster J et al.(1998) Plant J. 15:435-440). 
Beispielhaft fiir Translationsverstarker sei die 5 ' -Leaderseguenz 
aus dem Tabak-Mosaik-Virus zu nennen (Gallie et al. (1987) Nucl 

45 Acids Res 15:8693-8711). 



10 
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Als Kontrollsequenzen geeignete Polyadenylierxingssignale sind 
insbesondere Polyadenylierungssignale pflanzlicher Gene sowie 
T-DNA Polyadenylierungssignale aus Affrobacterivm tvmefaciens. 
Beispiele far besonders geeignete Terminatorsequenzen sind 
der OCS (Octopin-Synthase) -Terminator iind der NOS (Nopalin- 
Synthase) -Terminator (Depicker A et al (1982) J Mol Appl Genet 
1:561-573)/ als auch die Terminatoren von Sojabohnen Actin, 
RlfBISCO Oder alpha-Amylase aus Weizen (Baulcombe DC et al (1987) 
Mol Gen Genet 209:33-40). 

Die Expressionskassette kann vorteilhaf terweise eine oder mehrere 
sogenannte "enhancer Sequenzen" funktionell verkniipft mit dem 
Promoter enthalten, die eine erhohte transgene Expression der 
NukleinsSuresecjuenz ermSglichen. 



15 



Genetische Kontrollsequenzen meint ferner Sequenzen, die fttr 
Fusionsproteine bestehend aus einer Signalpeptidsequenz kodieren. 
Die Expression eines Zielgenes ist in jedem gewunschten Zell- 
kompartiment, wie z.B. dem Endomembransystem, der Vakuole und 
20 den Chloroplasten mSglich. Durch Nutzung des sekretorischen Weges 
sind gewQnschte Glykosylierungsreaktionen, besondere Faltungen 
U.S. moglich. Auch die Sekretion des Zielproteins zur Zellober- 
flache bzw. die Sezemierung ins Kulturmedium, beispielsweise 
bei Nutzung suspensionskultivierter Zellen oder Protoplasten ist 
25 mSglich. Die dafiir notwendigen Targetsequenzen kSnnen sowohl in 
einzelnen Vektorvariationen beriicksichtigt werden als auch durch 
VerwendTing einer geeigneten Klonierungsstrategie gemeinsam mit 
dem zu klonierenden Zielgen in den Vektor mit eingebracht werden. 
Als Targetsequenzen kSnnen sowohl Gen-eigene, sofern vorhanden, 
30 Oder heterologe Sequenzen genutzt werden. Zusatzliche, hetero- 
loge zur funktionellen Verknilpfung bevorzugte aber nicht darauf 
beschrankte Sequenzen sind weitere Targeting-Sequenzen zur 
GewShrleistung der subzellulSren Lokalisation im Apoplasten, 
in der Vakuole, in Plastiden, im Mitochondrium, im Endoplas- 
35 matischen Retikulum (ER) , im Zellkern, in 5lk6rperchen oder 
anderen Kon^jart intent en; sowie Translationsverstarker wie die 
5'-Leaderseguenz aus dem Tabak-Mosaik-Virus (Gallie et al. (1987) 
Nucl Acids Res 15: 8693-8711) und dergleichen. Das Verfahren, 
an sich nicht in den Plastiden lokalisierte Proteine, gezielt 
40 in die Plastiden zu transport ier en ist beschrieben (Klosgen RB 
und Weil JH (1991) Mol Gen Genet 225 (2 ): 297-304; Van Breusegem 
F et al. (1998) Plant Mol Biol 38 (3 ): 491-496) . 

Als Kontrollsequenzen sind weiterhin solche zu verstehen, die 
45 eine homologe Rekombination bzw. Insertion in das Genom eines 
Wirtsorganismus erm5glichen oder die Entfemung aus dem Genom 
erlauben. Methoden wie die cre/lox-Technologie erlauben eine 
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gewebsspezifische, \mter Umstanden induzierbare Entfemung der 
Expressionskassette aus dem Genom des Wirtsorganismus (Sauer B. 
Methods. 1998; 14 (4) : 381-92) . Hier werden best iinmte f lankier ende 
Sequenzen dem Zielgen angefiigt (lox-Sequenzen) , die spater eine 
5 Entfernung mittels der cre-Rekombinase ermoglichen. 

Bevorzugt kann die Expressionskassette, bestehend aus einer 
VerknUpfung von Promoter \ind zu transkribierender Nukleinsaure- 
sequenz, integriert in einem Vektor vorliegen und durch zum Bei- 
10 spiel Transformation - nach einem der unten beschriebenen Ver- 
fahren - in die pflanzliche Zelle oder Organismus eingebracht 
werden . 

^Transgen" meint bevorzugt - beispielsweise in Bezug auf eine 
15 transgene Expressionskassette, einen transgenen Expressions- 

vektor, einen transgenen Organismus oder Verfahren zur transgenen 
Expression von Nukleinsauren - alle solche durch gentechnische 
Methoden zustande gekommene Konstruktionen oder Verfahren unter 
Verwendung derselben, in denen entweder 

20 

a) die zu exprimierende Niikleinsauresequenz , oder 

b) der mit der zu exprimierenden Nukleinsauresequenz gemafi a) 
funktionell verkntipfte Promotor, oder 

25 

c) (a) und (b) 

sich nicht in ihrer natiirlichen, genetischen Umgebung (d.h. an 
ihrem natiirlichen chromosomalen Locus) befinden oder durch gen- 

30 technische Methoden modifiziert wurden, wobei die Modifikation 
beispielhaft eine Substitution, Addition, Deletion, Inversion 
Oder Insertion eines oder mehrerer Nukleotidreste sein kann. 
Naturliche genetische Umgebung meint den naturlichen chromo- 
somalen Locus in dem Herkunf tsorganismus oder das Vorliegen 

35 in einer genomischen Bibliothek. 

'^Transgen" meint in Bezug auf eine Expression { "trsuasgene 
Expression") bevorzugt all solche unter Einsatz einer transgenen 
Expressionskassette, transgenen Express ions vektor oder transgenen 
40 Organismus - entsprechend dem oben gegebenen Def initionen - 
realisierten Expressionen. 

Die im Rahmen des erf indungsgemassen Verfahren zum Einsatz 
koiranenden DNA-Konstrukte und die von ihnen abgeleiteten 
45 Vektoren kSnnen weitere Funktionselemente enthalten. Der 

Begriff Funktionselement ist breit zu verstehen \ind meint all 
solche Elemente, die einen Einfluss auf Herstelliing, Vermehrung 
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Oder Funktion der DNA-Konstrukte oder von diesen abgeleitete 
Vektoren oder Organismen haben. Beispielhaft aber nicht ein- 
schrSnkend seien zu nennen: 



5 1. Selektionsmarker 

Selektionsmarker umfassen beispielsweise solche NukleinsSure- 
oder Proteinsequenzen, deren Expression einer Zelle, Gewebe oder 
Organismus einen Vorteil (positiver Selektionsmarker) oder Nach- 

10 teil (negativer Selektionsmarker) gegentiber Zellen vermittelt. 
die diese Nukleinsaure oder Protein nicht exprimieren . Positive 
Selektionsmarker wirken beispielsweise dadurch, dass eine auf 
die Zelle inhibitorisch wirkende Substanz detoxif iziert wird 
(Bsp. Antibiotika-ZHerbizidresistenz) , oder eine Substanz 

15 gebildet wird, welche der Pflanze unter den gewahlten Bedingungen 
verbesserte Regeneration oder erhohtes Wachstum ermoglicht 
(zum Beispiel nutritive Marker, hormonproduzierender Marker wie 
ipt; S.U.). Eine andere Form positiver Selektionsmarker umfasst 
mutierte Proteine oder RNAs, die gegeniiber einem selektiven Agenz 

20 nicht empfindlich sind (beispielsweise 16S rRNA Mutanten, die 

unempf indlich gegeniiber Spectinomycin sind) . Negative Selektions- 
marker wirken beispielsweise dadurch, dass sie die Bildung einer 
toxischen Substanz in den transformierten Zellen katalysieren 
(zum Beispiel das codA Gen) . 



25 



1.1 Positive Selektionsmarker: 



Die DNA-Konstrukte k5nnen zur weiteren Steigerung der Effizienz 
zusatzliche positive Selektionsmarker umfassen. In einer bevor- 

30 zugten AusftUuningsf orm kann so das erf indungsgemaSe Verfahren 
im Form einer doppelten Selektion realisiert warden, wobei 
zusammen mit der zu insertierenden Nukleinsauresequenz ein 
Sequenz kodierend ftir eine Resistenz gegen mindestens ein Toxin, 
Antibiotikum oder Herbizid eingebracht wird, und die Selektion 

35 zusatzlich unter Einsatz des Toxins, Antibiotikums oder Herbizids 
erfolgt . 

Entsprechende Proteine und. Sequenzen von positiven Selektions- 
markem sowie Selektionsverf ahren sind dem Fachmann gelaufig. Der 

40 Selektionsmarker verleiht den erfolgreich transformierten Zellen 
eine Resistenz gegen ein Biozid (zum Beispiel ein Herbizid wie 
Phosphinothricin, Glyphosat oder Bromoxynil) , einen Metabolismus- 
inhibitor wie 2-Desoxyglucose-6-phosphat (WO 98/45456) oder em 
Antibiotikum, wie zum Beispiel Tetracycline, Ampicillin, Kana- 

45 mycin, G 418, Neomycin, Bleomycin oder Hygromycin. Beispielhaft 
als Selektionsmarker seien genannt: 
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Phosphinothricinacetyltransferasen (PAT), welche die freie 
Aminogruppe des Glut aminsynthaseinhibi tors Phosphinothricin 
(PPT) acetylieren iind damit eine Detoxif izierung des PPT 
erreichen (de Block et al. (1987) EMBO J 6:2513-2518) (auch 
Bialophos® Resistenzgen (bar) genaimt) . Entsprechende 
Sequenzen sind dem Fachmann bekannt (aus Streptomyces hygro- 
scopicus GenBank Acc.-No.: X17220 und X05822, aus Strepto- 
myces viridochromogenes GenBank Acc.-No.: M 22827 \ind X65195; 
US 5,489,520). Ferner sind synthetische Gene far die 
Expression in Plastiden beschrieben. Ein syntbetisches 
PAT-Gen ist beschrieben in Becker et al . (1994) Plant J 
5:299-307. Die Gene verleihen Resistenz gegen das Herbizid 
Bialaphos oder Glufosinat und sind vielbenutzer Marker in 
transgenen Pflanzen (Vickers JE et al. (1996) Plant Mol 
Miol Reporter 14:363-368; Thompson CJ et al. (1987) EMBO J 
6:2519-2523) . 

5-Enolpyruvylshikimat-3-phosphatsynthasen (EPSPS) , die eine 
Resistenz gegen Glyphosat (N- (phosphonomethyl) glycin) ver- 
leihen. Das \mselektive Herbizid Glyphosat hat die 5-Enol- 
pyruvyl-3-phosphoshikimat synthase (EPSPS) als molekulares 
Target. Diese hat eine Schlilsselfunktion in der Biosynthese 
aromatischer Aminosauren in Mikroben und Pflanzen, jedoch 
nicht in Saugem (Steinrucken HC et al. (1980) Biochem Bio- 
phys Res Commun 94:1207-1212; Levin JG und. Sprinson DB 
(1964) J Biol Chem 239:1142-1150; Cole DJ (1985) Mode of 
action of glyphosate a literature analysis, p. 48-74. In: 
Grossbard E und Atkinson D (eds.). The herbicide glyphosate. 
Butter sworths, Boston.). Glyphosat-tolerante EPSPS Varianten 
werden bevorzugt als Selektionsmarker verwendet (Padgette SR 
et al. (1996). New weed control opportunities: development of 
soybeans with a Roiindup Ready gene. In: Herbicide Resistant 
Crops (Duke, S.O., ed.), pp. 53-84. CRC Press, Boca Raton, 
FL; Saroha MK und Malik VS (1998) J Plant Biochemistry and 
Biotechnology 7:65-72). Das EPSPS Gen des Agrobakterium sp. 
strain CP4 hat eine naturliche Toleranz gegen Glyphosat, 
die auf entsprechende transgene Pflanzen trans feriert 
werden kann. Das CP4 EPSPS Gen wurde aus Agrobakterium sp. 
strain CP4 kloniert (Padgette SR et al. (1995)Crop Science 
35 (5) : 1451-1461) . Sequenzen von EPSPS-Enzymen , die Glyphosat- 
tolerant sind, sind beschrieben (u.a. in US 5,510,471; 
US 5,776,760; US 5,864,425; US 5,633,435; US 5,627;061; 
US 5,463,175; EP 0 218 571). Weitere Sequenzen sind 
beschrieben unter GenBank Acc.-No: X63374 oder M10947. 
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Glyphosat® degradierende Enzyme (gox Gen; Glyphosatoxido- 
reduktase) . GOX (beispielsweise die Glyphosatoxidoreductase 
aus Achromobacter sp.) katalysiert die Spaltung einer C-N 
Bindung im Glyphosat, welches so zu Aminomethylphosphonsaxire 
(AMPA) und Glyoxylat imgesetzt wird. GOX kann dadurch eine 
Resistenz gegen Glyphosat vermitteln ( Padgett e SR et al. 
(1996) J Nutr 126 (3 ): 702-16; Shah D et al . (1986) Science 
233:478-481) • 

Das deh Gen kodiert fur eine Dehalogenase , die Dalapon® 
inaktiviert ( GenBank Acc . -No . : AX022822, AX022820 sowie 
WO 99/27116) 

Die bxn Gene kodieren fur Bromoxynil degradierende Nitrilase- 
enzyme (Genbank Acc.-No: E01313 und J03196) • 

Neomycinphosphotransf erasen verleihen eine Resistenz 
gegen Antibiotika (Aminoglykoside) wie Neomycin, G418, 
Hygromycin, Paromomycin oder Kanamycin, indem sie 
durch eine Phosphorylierungsreaktion deren inhibierende 
Wirkung reduzieren. Besonders bevorzugt ist das nptll Gen. 
Sequenzen konnen aus der GenBank erhalten werden (AF080390; 
AF080389) . Zudem ist das Gen bereits Bestandteil zahlreicher 
Expressionsvektoren und kann unter Verwendung von dem 
Pachmann gelSufigen Verfahren aus diesen isoliert werden 

(AF234316; AF234315; AF234314) . Das NPTII Gen kodiert fur 
eine Aminoglycosid-3 'O-phosphotransf erase aus E.coli, Tn5 

(GenBank Acc.-No: U00004 Position 1401-2300; Beck et al. 

(1982) Gene 19 327-336). 

Das DOG^l-Gen wurde aus der Hefe Saccharomyces cerevisiae 
isoliert (EP-A 0 807 836) und kodiert ftir eine 2-Desoxy- 
glukose-6-phosphat Phosphatase, die eine Resistenz gegenuber 
2-DOG verleiht (Randez-Gil et al. (1995) Yeast 11:1233-1240; 
Sanz et al. (1994) Yeast 10:1195-1202, GenBank Acc.-No. : 
NC001140; Position 194799-194056). 

Acetolactatsynthasen, die eine Resistenz gegen Imidazolinon/ 
Sulfonylurea-Herbizide verleihen (GenBank Acc-No. : X51514; 
Sathasivan K et al. (1990) Nucleic Acids Res. 18(8):2188); 
AB049823; AF094326; X07645; X07644; A19547; A19546; A19545; 
105376; 105373; AL133315) 

Hygroinycinphosphotransf erasen (z.B. GenBank Acc-No. : X74325) 
die eine Resistenz gegen das Antibiotikum Hygromycin ver- 
leihen. Das Gen ist Bestandteil zahlreicher Expressions- 
vektoren und kann imter Verwend\mg von dem Fachmann 
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gelauf igen Verfahren (wie beispielsweise Polymeraseketten- 
reaktion) aus diesen isoliert werden (GenBank Acc-No.: 
AF294981; AF234301; AF234300; AF234299; AF234298; AF354046; 
AF354045) 

5 

Resistenzgene gegen 

a) Chloramphenicol (Chloramphenicolacetyltransf erase) , 

10 b) Tetracyclin (u.a. GenBank Acc -No. : X65876; X51366) . Zudem 

ist das Gen bereits Bestandteil zahlreicher Expressions- 
vektoren und kann \inter Verwendimg von deia Fachmann 
gelaufigen Verfahren (wie beispielsweise Polymerase- 
kettenreaktion) aus diesen isoliert werden 



15 



c) Streptomycin (u.a. GenBank Acc. -No. : AJ278607) 
d) 



Zeocin, das entsprechende Resistenzgen ist Bestandteil 
zahlreicher Kloniervmgsvektoren (z.B. GenBank Acc. -No.; 
20 L36849) und kann unter Verwendomg von dem Fachitiann 

gelaufigen Verfahren (wie beispielsweise Polymerase- 
kettenreaktion) aus diesen isoliert werden. 



e) Ampicillin (IS-Lactamase Gen; Datta N, Richmond MH 
25 (1966) Biochem J 98(l):204-9; Heffron F et al (1975) 

J. Bacterid 122: 250-256; Bolivar F et al . (1977) 
Gene 2:95-114), Die Sequenz ist Bestandteil zahlreicher 
Klonierxingsvektoren und kann unter Verwendung von dem 
Fachmann gelaufigen Verfahren (wie beispielsweise Poly- 
30 merasekettenreaktion) aus diesen isoliert werden. 

Gene wie die Isopentenyltransf erase aus Agrobakterium tumefaciens 
(strain:P022) (Genbank Acc. -No. : AB025109) kdnnen auch als Selek- 
tionsmarker eingesetzt werden. Das ipt Gen ist ein Schliisselenzym 

35 der Cytokinin-Biosynthese . Seine Uberexpression erleichtert die 
Regeneration von Pflanzen (z.B. Selektion auf Cytokinin-f reiem 
Medium) . Das Verfahren zur Nutzxing des ipt Gens ist beschrieben 
(Ebinuma H et al . (2000) Proc Natl Acad Sci USA 94:2117-2121; 
Ebinuma H et al. (2000) Selection of Marker-free transgenic 

4Q plants using the oncogenes (ipt, rol A, B, C) of Agrobakterium 
as selectable markers. In Molecular Biology of Woody Plants. 
Kluwer Academic Publishers) . 

Verschiedene weitere positive Selektionsmarker , die den trans - 
formierten Pflanzen einen Wachstumsvorteil gegenuber nicht-trans- 
formierten verleihen, sowie Verfahren zu ihrer Verwendung sind 
u.a. beschrieben in EP-A 0 601 092. Beispielhaft sind zu nennen 
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P-Glucuronidase (in Verbindung mit z.B. Cytokininglucuronid) , 
Maimose-e-phosphat-lsomerase (in Verbindung mit Mannose) , UDP- 
Galaktose-4-Epimerase (in Verbindung mit z.B. Galactose). 

5 Fur einen in Plastiden funktionellen Selektionsmarker sind ins- 
besondere solche bevorzugt, die eine Resist enz gegen Spectino- 
mycin. Streptomycin, Kanamycin, Lincomycin, Gentamycin, Hygro 
mycin, Methotrexat, Bleomycin, Phleomycin, Blasticidin, Sulfon- 
amid,, Phosphinotricin, Chlorsulfuron, Bromoxymil, Glyphosat, 

10 2,4-Datrazin, 4-methyl tryptophan, Nitrat, S-aminoethyl- 

L-cysteine, Lysin/Threonin, Aminoethyl-Cystein oder Betainaldehyd 
verleihen. Besonders bevorzugt sind die Gene aadA, nptll, BADH, 
FLARE-S (eine Fusion aus aadA und GFP, beschrieben bei Khan MS 
& Maliga P (1999) Nature Biotech 17:910-915). Geeignet ist vor 

15 allem das aadA Gen (Svab Z und Maliga P (1993) Proc Natl Acad 
Sci USA 90:913-917). Femer beschrieben sind modif izierte 16S 
rDNA sowie die Betainealdehyddehydrogenase (BADH) aus Spinat 
(Daniell H et al. (2001) Trends Plant Science 6:237-239; Darnell 
H et al. (2001) Curr Genet 39:109-116; WO 01/64023; WO 01/64024; 

20 WO 01/64850) . Auch lethal wirkende Agenzen wie beispielsweise 

Glyphosat kSnnen in Verbindung mit entsprechend detoxif izierenden 
Oder resistenten Enzymen genutzt werden (WO 01/81605) . 

Die jeweils fiir die Selektion verwendeten Konzentrationen 
25 der Antibiotika, Herbizide, Biozide oder Toxine miissen an die 
jeweiligen Testbedingungen bzw. Organismen angepasst werden. 
Beispielhaft seien fiir Pflanzen zu nennen Kanamycin (Km) 50 mg/L, 
Hygromycin B 40 mg/L, Phosphinothricin (Ppt) 6 mg/L, Sepctino- 
mycin (Spec) 500 mg/L. 



30 



2 . Reportergene 

Reportergene kodieren f<ir leicht quantif izierbare Proteine 
und gewShrleisten so tiber Eigenfarbe oder Enzymaktivitat erne 
35 Bewertung der Transf ormationsef f izienz , des Expressionsortes oder 
-zeitpunktes. Ganz besonders bevorzugt sind dabei Gene kodierend 
for Reporter-Proteine (siehe auch Schenbom E, Groskreutz D 
(1999) Mol Biotechnol 13(l):29-44) wie 

"green fluorescence protein- (GFP) (Chui WL et al . (1996) 
Curr Biol 6:325-330; Leffel SM et al. (1997) Biotechnigues 
23(5):912-8; Sheen et al. (1995) Plant J 8 (5) :777-784; 
Haseloff et al. (1997) Proc Natl Acad Sci USA 94(6): 
2122-2127; Reichel et al. (1996) Proc Natl Acad Sci USA 
45 93 (12) :5888-5893; Tian et al. (1997) Plant Cell Rep 

16:267-271; WO 97/41228) 
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Chloramphenicol transferase 
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Luzif erase (Millar et al. (1992) Plant Mol Biol Rep 10: 
324-414; Ow et al . (1986) Science 234:856-859); erlaubt 
Bioluminescenzdetektion 

p-Galactosidase (kodiert ftir ein Enzym fiir das verschiedenen 
chromogene Substrate zur Verfugrmg stehen) 

jS-Glucuronidase (GUS) (Jefferson et al, (1987) EMBO J 6: 
3901-3907) Oder das uidA Gen (kodieren fur Enzyme fiir die 
verschiedene chromogene Siibstrate zur Verfugung stehen) 

R-Locus Genprodukt, das die Produktion von Anthocyanin- 
pigmenten (rote Farbung) in pflanzlichen Gewebe reguliert und 
so eine direkte Analyse der Promoteraktivitat ohne Zugabe 
zusatzlicher Hilfsstoffe oder chromogener Substrate erm6g- 
licht (Dellaporta et al. (1988) In: Chromosome Structure 
and Function: Impact of New Concepts, 18th stadler Genetics 
Symposium, 11 : 263-282 ) 

Tyrosinase (Katz et al. (1983) J Gen Microbiol 129:2703- 
2714) , Enzym, das Tyros in zu DOPA und Dopaquinon oxidiert, 
die infolge das leicht nachweisbare Melanin bilden. 

Aequorin (Prasher et al. (1985) Biochem Biophys Res Commun 
126 (3) : 1259-1268) , kann in der Calci\am-sensitiven Bio- 
luminescenzdetektion verwendet werden. 

3. Replikationsurspriinge, die eine Vermehrung der erfindungs- 
gemaSen Expressionskassetten oder Vektoren in zum Beispiel 
E.coli gewahrleisten. Beispielhaft seien genannt ORI (origin 
of DNA replication) , der pBR322 ori oder der P15A ori 
(Sambrook et al.: Molecular Cloning. A Laboratory Manual, 
2^^ ed. Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, NY, 1989) . 

4 . Elemente zum Beispiel " Border sequenz en" , die einen Agro- 
bakterien-vermittelte Transfer in Pf lanzenzellen fur 
die Ubertragxing ixnd Integration ins Pf lanzengenom ermog- 
lichen, wie z\am Beispiel die rechte oder linke Begrenzung 
der T-DNA oder die vir-Region. 

5. Multiple Klonierungsregionen (MCS) erlauben und erleichtem 
die Insertion eines oder mehrerer NukleinsSureseguenzen. 
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Die Einfiilirung von Nukleinsaureseqaenzen (z.B. Expressions- 
kassetten) in einen pflanzlichen Organismus oder Zellen, Geweben, 
Organe, Teile bzw. Samen desselben kann vorteilhaft tinter Ver- 
wendung von Vektoren realisiert werden, in denen diese Sequenzen 
5 enthalten sind. Vektoren konnen beispielhaft Plasmide, Cosmide, 
Phagen, Viren oder auch Agrobakterien sein. Die Sequenzen k6nnen 
in den Vektor (bevorzugt ein Plasmidvektor) liber geeignete 
Restriktionsschnittstellen insertiert werden. Der entstandene 
Vektor kann zunachst in E.coli eingefiihrt und an^lif iziert 

10 werden. Korrekt trans formierte E.coli werden selektioniert , 

geziichtet und der rekombinante Vektor mit dem Fachmann gelauf igen 
Metboden gewonnen. Restriktionsanalyse und Sequenzierung konnen 
dazu dienen, den Klonierungsschritt zu liberprufen. Bevorzugt sind 
solche Vektoren, die eine stabile Integration in das Wirtsgenom 

15 ermoglichen. 

Die Herstellung eines transf oarmierten Organismus (bzw. einer 
trans formier ten Zelle oder Gewebes) erfordert, dass die ent- 
sprechende DNA (z.B. der Transf ormationsvekt or) oder RNA in die 

20 entsprechende Wirtszelle eingebracht wird. Fiir diesen Vorgang, 
der als Transformation (oder Transduktion bzw. Transf ekt ion) 
bezeichnet wird, steht eine Vielzah.1 von Methoden und Vektoren 
zur Verfiigung (Keown et al. (1990) Methods in Enzymology 
185:527-537; Plant Molecular Biology and Biotechnology (CRC 

25 Press, Boca Raton, Florida), Kapitel 6/7, S. 71-119 (1993); 

White FF (1993) Vectors for Gene Transfer in Higher Plants; in: 
Transgenic Plants, Bd. 1, Engineering and Utilization, Hrsgb. : 
Kung und Wu R, Academic Press, 15-38; Jenes B et al. (1993) 
Techniques for Gene Transfer, in: Transgenic Plants, Bd. 1, 

30 Engineering and Utilization, Hrsgb. : Kung und R. Wu, Academic 
Press, S. 128-143; Potrykus (1991) Annu Rev Plant Physiol Plant 
Molec Biol 42:205-225; Halford NG, Shewry PR (2000) Br Med Bull 
56(1) :62-73) . 

35 Beispielsweise kann die DNA oder R]S[A direkt durch Mikroinjektion 
(WO 92/09696, WO 94/00583, EP-A 0 331 083, EP-A 0 175 966) oder 
durch Bombardierung mit DNA bzw. RNA-beschichteten Mi3cropartikeln 
(biolistische Verfahren mit der Genksmone ''particle bombardment''; 
US 5,100,792; EP-A 0 444 882; EP-A 0 434 616; Froinm ME et al . 

40 (1990) Bio /Technology 8(9):833-9; Gordon-Kairan et al . (1990) Plant 
Cell 2:603) eingefiihrt werden. Auch kann die Zelle chemisch, zum 
Beispiel mit Polyethylenglycol , permeabilisiert werden, so dass 
die DNA durch Diffusion in die Zelle gelangen kann. Die DNA kann 
auch durch Protoplastenfusion mit anderen DNA-enthaltenden Ein- 

45 heiten wie Minicells, Zellen, Lysosomen oder Liposomen (Freeman 
et al. (1984) Plant Cell Physiol. 29:1353ff; US 4,536,475) 
erfolgen. Elektroporation ist eine weitere geeignete Methode 
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2ur Einfiihrving von DNA, bei der die Zellen reversibel durch 
einen elektrischen Impuls permeabilisert warden (EP-A 290 395, 
WO 87/06614) - Weitere VerfsJiren umfassen die Calciumphosphat- 
vermittelte Transformation, die DEAE-Dextran-vermittelte Trans- 
5 formation, die Inkubation trockener Embryonen in DNA-hal tiger 
Ldsiing, oder andere Methoden der direkten DNA-Einfiihrung 
(DE 4 005 152, WO 90/12096, US 4,684,611). Entsprechende Ver- 
fahren sind beschrieben (beispielsweise bei Bilang et al. (1991) 
Gene 100:247-250; Scheid et al . (1991) Mol Gen Genet 228:104-112; 

10 Guerche et al. (1987) Plant Science 52:111-116; Neuhause et al. 
(1987) Theor Appl Genet 75:30-36; Klein et al . (1987) Nature 
327:70-73; Howell et al . (1980) Science 208:1265; Horsch et 
al.(1985) Science 227:1229- 1231; DeBlock et al . (1989) Plant 
Physiology 91:694-701; Methods for Plant Molecular Biology 

15 (Weissbach and Weissbach, eds . ) Academic Press Inc. (1988); and 
Methods in Plant Molecular Biology (Schuler and Zielinski, eds.) 
Academic Press Inc. (1989)). Physikalische Methoden der DNA- 
Einfuhrung in pflanzliche Zelle sind im Uberblick dargestellt 
bei Oard (1991) Biotech Adv 9:1-11. 

20 

Im Falle dieser "direkten* Transf ormationsmethoden sind keine 
besonderen Anf orderiingen am das verwendete Plasmid gestellt. 
Einfache Plasmide wie die der pUC-Reihe, pBR322, M13mp Reihe, 
PACYC184 etc. konnen verwendet werden. 

25 

Neben diesen "direkten'' Transf ormationstechniken kann eine Trans- 
formation auch durch bakterielle Infektion mittels Agrobacteriiam 
(z.B. EP 0 116 718), virale Infektion mittels viraler Vektoren 
(EP 0 067 553; US 4,407,956; WO 95/34668; WO 93/03161) oder 
30 mittels Pollen (EP 0 270 356; WO 85/01856; US 4,684,611) durch- 
gefiihrt werden. 

Bevorzugt erfolgt die Tramsf ormation mittels Agrobacterien, 
die "entwaf fnete" (disarmed) Ti-Plasmidvektoren enthalten, 

35 wobei deren natiirliche Fahigkeit zum Gentransfer auf Pflanzen 
genutzt wird (EP-A 0 270 355; EP-A 0 116 718). Agrobacteriiam- 
Trans formation ist weit verbreitet far die Transformation von 
Dicotyledonen, wird aber auch zunehmend auf Monocotyledonen 
angewandt (Toriyama et al. (1988) Bio /Technology 6: 1072-1074; 

40 Zhang et al. (1988) Plant Cell Rep 7:379-384; Zhang et al. (1988) 
Theor Appl Genet 76:835-840; Shimamoto et al. (1989) Nature 
33 8:274-276; Datta et al . (1990) Bio /Techno logy 8: 73 6-740; 
Christou et al. (1991) Bio /Techno logy 9:957-962; Peng et al . 
(1991) International Rice Research Institute, Manila, Philippines 

45 563-574; Cao et al. (1992) Plant Cell Rep 11:585-591; Li et al. 

(1993) Plant Cell Rep 12:250-255; Rathore et al . (1993) Plant Mol 
Biol 21:871-884; Fromm et al. (1990) Bio /Technology 8:833-839; 
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Gordon-Katnm et al. (1990) Plant Cell 2:603-618; D'Halluin et al. 
(1992) Plant Cell 4:1495-1505; Walters et al. (1992) Plant Mol 
Biol 18:189-200; Koziel et al . (1993) Biotechnology 11:194-200; 
Vasil IK (1994) Plant Mol Biol 25:925-937; Weeks et al. (1993) 
5 Plant Physiol 102:1077-1084; Somers et al. (1992) Bio /Technology 
10:1589-1594; WO 92/14828; Hiei et al. (1994) Plant J 6:271-282). 

Die fiir die Agrobacterium-Trans formation meist verwendeten StSmme 
Agrobacterium tumefaciens oder Agrobacterium rhizogenes enthalten 

10 ein Plasmid (Ti bzw. Ri Plasmid) , das auf die Pflanze nach Agro- 
bakterium-lnfektion iibertragen wird. Ein Teil dieses Plasmids, 
genannt T-DNA (transferred DNA) , wird in das Genom der Pflanzen- 
zelle integriert. Altemativ konnen durch Agrobakterium auch 
binare Vektoren (Mini-Ti-Plasmide) auf Pflanzen Obertragen und 

15 in deren Genom integriert werden. 

Die Anwendung von Agrobakteriim tvimefaciens ftlr die Trans- 
formation von Pflanzen unter Verwendxing von Gewebekultur- 
explantaten ist beschrieben (u.a. Horsch RB et al. (1985) 

20 Science 225:1229ff; Fraley et al. (1983) Proc Natl Acad Sci 
USA 80: 4803-4807; Bevans et al. (1983) Nature 304:184-187). 
Viele Stamme von Agrobakterium tumefaciens sind in der Lage, 
genet isches Material zu tlbertragen, wie z.B. die Stamme 
EHAlOl [pEHAlOl] , EHAl05[pEHAl05] , LBA4404[pAL4404] , C58Cl[pMP90] 

25 -and C58C1 [pGV2260] (Hood et al. (1993) Transgenic Res 2:208-218; 
Hoekema et al. (1983) Nature 303:179-181; Koncz and Schell (1986) 
Gen Genet 204:383-396; Deblaere et al. (1985) Nucl Acids Res 13: 
4777-4788) . 

30 Werden Agrobacterien verwendet, so ist die Expressionskassette 
in spezielle Plasmide zu integrieren, entweder in einen Zwischen- 
vektor (englisch: shuttle or intermediate vector) oder einen 
binaren Vektor. Wird ein Ti oder Ri Plasmid zur Transformation 
verwendet, ist zumindest die rechte Begrenzung, meistens jedoch 

35 die rechte und die linke Begrenzung der Ti oder Ri Plasmid T-DNA 
als flankierende Region mit der einzufiihrenden Expressionskas- 
sette verbunden. Bevorzugt werden binare Vektoren verwendet. 
BinSre Vektoren konnen sowohl in E.coli als auch in Agrobacterium 
replizieren und enthalten die z\ir Ubertragung in ein pflanzliches 

40 System erf orderlichen Komponenten. Sie enthalten in der Regel ein 
Selektionsmarkergen fOr die Selektion trans formierter Pflanzen 
(z.B. das nptll Gen, das eine Resistenz gegen Kanamycin verleiht) 
xaik einen Linker oder Polylinker flankiert von der rechten und 
linken T-DNA Begrenzungssequenz . AuSerhalb der T-DNA-Begrenzungs- 

45 se«iuenz enthalten sie zudem noch einen Selektionsmarker , der eine 
Selektion transf ormierter E.coli und/ oder Agrobakteria ermoglicht 
(z.B. das nptlll Gen, das eine Resistenz gegen Kanamycin ver- 
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leiht) . Entsprechende Vektoren konnen direkt in Agrobakterium 
transformiert werden (Holsters et al. (1978) Mol Gen Genet 
163:181-187) . 

5 BinSrvektoren basieren z.B. auf "broad host range" -PI asmiden 
wie PRK252 (Sevan et al. (1984) Nucl Acid Res 12,8711-8720) und 
PTJS75 (Watson et al. (1985) EMBO J 4(2):277- 284). Eine grosse 
Gruppe der verwendeten Binarvektoren leitet sich vom pBINl9 
(Bevan et al. (1984) Nucl Acid Res 12:8711-8720) ab. Hajdukiewicz 
10 et al. entwickelten einen BinSrvektor (pPZP) , der kleiner und ef- 
fizienter als die bisher ublichen ist (Hajdukiewicz et al . (1994) 
Plant Mol Biol 25:989-994). Verbesserte ujid besondere bevor- 
zugte binare Vektorsysteme zur Agrobakteri\jin-vennittelten Trans- 
formation sind in WO 02/00900 beschrieben . 

15 

Die mit einem solchen Vektor transformiert en Agrobakterien kannen 
daxm in bekannter Weise zur Transformation von Pflanzen, ins- 
besondere von Kulturpf lanzen, wie z.B. von Raps, verwendet 
werden, indem beispielsweise verwundete Blatter oder Blattstiicke 

20 in einer Agrobakterienlosung gebadet und anschliessend in geeig- 
neten Medien kultiviert werden. Die Transformation von Pf lanzen 
durch Agrobakterien ist beschrieben (White FF, Vectors for 
Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, 
Engineering and Utilization, herausgegeben von S.D. K\mg und 

25 R. Wu, Academic Press, 1993, S. 15-38; Jenes B et al. (1993) 
Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, 
Engineering and Utilization, herausgegeben von S.D. Kung xind 
R. Wu, Academic Press, S. 128-143; Potrykus (1991) Annu Rev 
Plant Physiol Plant Molec Biol 42:205- 225). Aus den trans- 

30 formierten Zellen der verwundeten Blatter bzw. Blattstiicke 

kannen in bekannter Weise transgene Pf lanzen regeneriert werden. 

Far die Transformation k6nnen unterschiedliche Explantate, Zell- 
kultTiren, Gewebe, Organen, Embryonen, Samen, Mikrosporen oder 

35 anderen einzelzelligen oder mehrzelligen zellulare Strukturen 
abgeleitet von einem pflanzlichen Organisraus eingesetzt werden. 
Auf die jewel ligen E>«plantate, Kulturen oder Gewebe abgestimmte 
Transformationsverfahren sind dem Fachmann bekannt. Beispielhaft 
seien zu nennen: Sprossintemodien (Fry J et al. (1987) Plant 

40 Cell Rep. 6:321-325), Hypokotyle (Radke SE et al . (1988) Theor 
Appl Genet 75:685-694; Schroder M et al. (1994) Physiologia Plant 
92: 37-46.; Stefanov I et al . (1994) Plant Sci. 95:175-186; Weier 
et al. (1997) Fett/Lipid 99:160-165), kotyledonare Petiolen 
(Meloney MM et al. (1989) Plant Cell Rep 8:238-242; Weier D 

45 et al. (1998) Molecular Breeding 4:39-46), Mikrosporen und Pro- 
embryonen (Pechnan (1989) Plant Cell Rep. 8:387-390) und Bltiten- 
stiele (Boulter ME et al . (1990) Plant Sci 70:91-99; Guerche P 
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et al. (1987) Mol Gen Genet 206:382-386). Bei einem direkten Gen- 
transfer konnen Mesophyllprotoplasten (Chapel PJ & Glimelius K 
(1990) Plant Cell Rep 9: 105-108; Golz et al . (1990) Plant 
Mol Biol 15:475-483) aber auch Hypokotylprotoplasten (Bergmann 
5 P & Glimelius K (1993) Physiologia Plant 88:604-611) und Mikro- 
sporen (Chen JL et al. (1994) Theor Appl Genet 88:187-192; 
Jonesvilleneuve E et al . (1995) Plant Cell Tissue and Organ 
Cult 40:97-100) \md Sprossabschnitte (Seki M et al . (1991) 
Plant Mol Biol 17:259-263) erfolgreich eingesetzt werden. 

10 

Stabil transformierte Zellen d.h, solche, die die eingefiihrte 
DNA integriert in die DNA der Wirtszelle en thai ten, konnen von 
untransfonnierten unter Einsatz des erf indungsgemSSen Selektions- 
verfahrens selektioniert werden. Die erhaltenen Pflanzen konnen 
15 in liblicher Weise gezxichtet und gekreuzt werden. Zwei oder mehr 
Generationen sollten vorzugsweise kultiviert werden, um sicher- 
zustellen, dass die genomische Integration stabil und vererblich 
ist . 

20 Sobald eine trans fonaierte Pf lanzenzelle hergestellt wurde, kann 
eine vollst&adige Pf lanze unter Verwendung von dem Fachmann 
bekannten Verfahren erhalten werden. Hierbei geht man beispiel- 
haft von Kalluskulturen, einzelnen Zellen (z.B. Protoplasten) 
Oder Blattscheiben aus (Vasil et al . (1984) Cell Culture and 

25 Somatic Cel Genetics of Plants, Vol I, II and III, Laboratory 

Procedures and nTheir Applications, Academic Press; Weissbach and 
Weissbach (1989) Methods for Plant Molecular Biology, Academic 
Press) . Aus diesen noch undif f erenzierten Callus-Zellmassen kann 
die Bildung von Spross und Wurzel in bekannter Weise induziert 

30 werden. Die erhaltenen Sprosslinge konnen ausgepflanzt und 
gezuchtet werden. Entsprechende Verfahren sind beschrieben 
(Fennell et al . (1992) Plant Cell Rep. 11: 567-570; Stoeger 
et al. (1995) Plant Cell Rep. 14:273-278; Jahne et al. (1994) 
Theor Appl Genet 89:525-533). 

35 

Die Wirksamkeit der Expression der transgen exprimierten Nuklein- 
sSuren kann beispielsweise in vitro durch Sprossmeristemver- 
mehruag unter Verwendung einer der oben beschriebenen Selektions- 
methoden ermittelt werden. Zudem kann eine in Art und H5he ver- 
40 anderte Expression eines Zielgens und die Auswirkung auf den 
Phanptyp der Pf lanze an Testpflanzen in Gewachshausversuchen 
getestet werden. 

Bevorzugt wird das erf indoingsgemaSe Verfahren im Rahmen der 
45 pflanzenbiotechnologie zur Erzeugung von Pflanzen mit vor- 
teilhaften Eigenschaf ten eingesetzt. Die in das Genom der 
pflanzlichen Zelle oder des pflanzlichen Organismus zu 
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insert ierende Nukleinsaiiresequenz" imifasst bevorzugt min- 
destens eine Expressionskassette, wobei besagte Expressions- 
kassette vinter Kontrolle eines in pflanzlichen Zellen oder 
pflanzlichen Organismen f xinktionellen Promotors eine RNA xind/oder 
5 ein Protein exprimieren kaim, welche nicht die Verminderung der 
Expression, Menge, Aktivitat \ind/oder Funktion eines Marker- 
proteins bewirken, sondem - besonders bevorzugt - der so 
genetische veranderten Pflanze einen vorteilhaf ten Phanotyp ver- 
leihen. Dem Fachmann sind zahlreiche Gene imd Proteine bekannt, 
10 die zum Erreichen eines vorteilhaf ten Phanotyp beispielsweise 
zur Qualitatssteigeriing bei Nahrungsmitteln oder zur Produktion 
bestimmter Chemikalien oder Pharmazeutika (Dunwell JM (2000) 
J Exp Bot 51 Spec No: 487-96) verwendet werden k5nnen. 

15 So kann die Eignvmg der Pflanzen oder deren Samen als Nahriings- 
oder Futtermittel verbessert werden, beispielsweise liber eine 
VerSnderimg der Zusammensetziingen iind/oder des Gehalt an Meta- 
boliten, insbesondere Proteinen, Olen, Vitaminen und/oder Starke. 
Auch konnen Wachstiimsrate, Ertrag oder die Resistenz gegen bio- 

20 tische oder abiotische Stressf aktoren erhoht werden. Vorteilhaf te 
Ef fekte konnen sowohl durch transgene Expression von Nuklein- 
sauren oder Proteinen als auch durch gezielte Verminderung der 
Expression endogener Gene hinsichtlich des Phanotypes der trans- 
genen Pflanze erzielt werden. Die in der transgenen Pflanze zu 

25 erzielenden vorteilhaf ten Ef fekte umfassen beispielsweise: 

Erhehte Resistenz gegen Pathogene (biotischer Stress) 

Erhohte Resistenz gegen Umwelteinf liisse wie Hitze, KSlte, 
30 Frost Trockenheit, UV-Licht, oxidativen Stress, Nasse, Salz 

etc. (abiotischer Stress) 

- Erh6hte Ertragsleistung 

35 - verbesserte Qualitat z.B. erhohter Nahrwert, erhohte Lager- 
f ahigkeit 

Ein weiterer Gegenstand der Erfindung betrif ft die Verwendung der 
nach dem erf indirngsgemassen Verfahren hergestellten transgenen 

40 Pflanzen, und der von ihnen abgeleitete Zellen, Zellkulturen, 
Telle Oder Vermehrungsgut wie Saaten oder Priichte, zur Her- 
stellung von Nahrungs- oder Futtermitteln, Pharmazeutika 
oder Feinchemikalien, wie beispielsweise Enzymen, Vitaminen, 
i=aainosauren, Zucker, Fettsauren, natiirliche und synthetische 

45 Geschmacks-, Aroma- und Farbstoffe. Besonders bevorzugt ist die 
Produktion von Triaclyglyceriden, Lipiden, Olen, FettsSiiren, 
Starke, Tocopherolen und Tocotrienolen sowie Carotinoiden. Von 
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Menschen und Tieren verzehrbare er f indungsgemaSe , genetisch 
veranderte Pflanzen koimen audi beispielsweise direkt oder nach 
an sich bekaxmter Aufbereitung als Nahrungsmittel oder Futter- 
mittel verwendet werden. 
5 Wie bereits oben erwahnt, imfasst das erf indiingsgemaSe Verfahren 
in einer besonders vorteilhaf ten Ausfiihrvingsf orm in einem der 
Selektion nachgeschalteten Verf alirenschritt die Deletion der fur 
das Markerprotein kodierenden Sequenz (z.B. durch Rekombinase 
vermittelt oder wie in W003/ 004659 beschrieben) bzw. die Aus- 

10 kreuzung xand/oder Segregation besagter Sequenzen. (Dem Fachinann 
ist klar, das dazu in den trans formier ten Zellen die in das Genom 
integrierte Nukleinsaiireseuqnz und die fur das Markerprotein 
kodierende Sequenz einen separaten chromosomalen Lokus aufweisen 
sollten. Dies ist jedoch bei der Mehrzahl der resultierenden 

15 Pflanzen allein aus statistischen Griinden gegeben) . Diese Vor- 
gehensweise ist insbesondere vorteilhaf t, wenn es sicb bei dem 
Markerprotein um ein Transgen handelt, das ansonsten in der zu 
trans formierenden Pflanze nicht vorkoitimt. Die resultierende 
Pflanze kann zwar noch unter Umstanden die Verbindung zur Ver- 

20 minderung der Expression, Menge, Aktivitat und/oder Funktion des 
Markerproteins beinhalten, doch hSLtte diese kein ^Gegenstack" 
mehr in Form des besagten Markerproteins, ware also wirkungslos . 
Dies ist insbesondere dann der Fall, wenn das Markerprotein aus 
einem nicht-pflanz lichen Organismus stammt \ind/oder synthetisch 

25 ist (beispielsweise das codA Protein) . Es k6nnen aber auch 

Pflanzliche Markperproteine aus anderen Pf lanzenarten eingesetzt 
werden, die in der zu trans formierenden Zelle ansonsten (d.h. 
wenn nicht als Transgen eingefiihrt) nicht vorkommen. Besagte 
Markerproteine sind im Rahmen dieser Erfindung als «nicht-endo- 

30 gene' Markerproteine bezeichnet, 

Ganz besonders vorteilhaf t ist es, wenn es sich bei der Ver- 
bindung zur Verminderung der Expression, Menge, Aktivitat 
Tind/oder Funktion des Markerproteins um eine RNA handelt. Nach 

35 der Deletion bzw. Auskreuzung/ Segregation wiirde die resultierende 
transgene Pflanze kein unn5tiges (und ggf . unerwOnschtes ) Fremd- 
protein mehr aufweisen, Einziges Fremdprotein ist u.U. das aus 
der in das Genom insertierten Nukleinsauresequenz resultierenden 
Protein. Aus Griinden der Produktzulassiing ist diese Ausftihrungs- 

40 form besondersvorteilhaf t . Wie oben beschrieben kann diese RNA 
eine antisense RNA oder - besonders bevorzugt - eine doppel- 
strangige RNA sein. Sie kann separat von der fiir das Zielprotein 
kodierenden RNA exprimiert werden, aber - unter UmstSnden - auch 
auf einem Strang mit derselben. 

45 
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Zusammenfassend vimfasst die besonders vorteilhafte Ausf uhrungs- 
form folgende Merkmale: 

Verfahren zur Herstellung trans formierter pflanzlicher Zellen 
5 Oder Organismen, umfassend nachfolgende Schritte: 

a) Transformation einer Population pflanzlicher Zellen, welche 
mindestens ein nicht-endogenes (bevorzugt nicht-pf lanzliches) 
Markerprotein umfasst, das in der Lage ist, eine f\ir besagte 

10 Population pflanzlicher Zellen nicht-toxische Substanz X in 

eine fiir besagte Population toxische Substanz Y direkt oder 
indirekt umzusetzen, mit mindestens einer zu insertierenden 
Nukleinsauresequenz in Kombination mit mindestens einer 
Nukleinsauresequenz kodierend filr eine Ribonukleinsaure- 

15 sequenz befahigt zur Verminderung der Expression, Menge, 

Aktivitat und/oder Funktion besagten Markerproteins, und 



b) Behandlung besagter Population pflanzlicher Zellen mit der 
Sxibstanz X in einer Konzentration, die infolge der Umsetziang 
durch das Markerprotein einen fur nicht-transf ormierte Zellen 
toxischen Effekt bedingt, und 

c) Selektion von trans formier ten pflanzlichen Zellen (\ind/oder 
Populationen pflanzlicher Zellen wie pflanzlichen Geweben 
Oder Pf lanzen) , die in ihrem Genom besagte Nukleinsaurese- 
quenz aufweisen und die infolge der Wirkung besagter Ver- 
bindung gegeniiber nicht-transf ormier ten Zellen einen Wachs- 
tumsvorteil haben, aus besagter Population pflanzlicher 
Zellen, wobei die Selektion unter Bedingungen durchgefiihrt 
wird, bei denen das Markerprotein seinen toxischen Effekt 
auf die nicht- trains formier ten Zellen ausiiben kann, und 



d) Regeneration von fertilen Pf lanzen, und 

35 e) Auskreuzung der fur das Markerprotein kodierenden Nuklein- 
sauresequenz und Isolation von fertilen Pf lanzen, die in 
ihrem Genom besagte Niikleinsauresequenz aber nicht mehr die 
far das Markerprotein kodierende Sequenz aufweisen. 



40 Sequenzen 



SEQ ID NO: 1 Nukl e ins aiire sequenz kodierend ftir Cytosin- 
deaminase aus E.coli (codA) 



45 2- SEQ ID NO: 2 AminosS-uresequenz kodierend fur Cytosin- 

deaminase aus E.coli (codA) 
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3. SEQ ID NO: 3 iSFukleinsauresequenz kodierend ftir Cytosin- 

deaitiinase aus E.coli (codA) mit modif iziertem 
Startkodon (GTG/ATG) ziir Expression in 
Eukaryoten 

5 

4. SEQ ID NO: 4 Aminosauresequenz kodierend far Cytosxn- 

deaminase aus E.coli (codA) mit modif iziertem 
Startkodon (GTG/ATG) zur Expression in 
Eukaryoten 

10 

5. SEQ ID NO: 5 NukleinsSuresequenz kodierend fur Cytochrom 

P45 0-SU1 (suaC) aus Streptomyces griseolus 

6- SEQ ID NO: 6 AminosSuresequenz kodierend fiir Cytochrom 

P450-SU1 (suaC) aus Streptomyces griseolus 

7. SEQ ID NO: 7 Nukleinsauresequenz kodierend fur 

Indolacetamidhydrolase (tms2) aus Agrobacteri\jm 
tumefaciens 

20 

8. SEQ ID NO: 8 Amino sauresequenz kodierend fiir 

Indolacetamidhydrolase (tms2) aus Agrobacterium 
tumefaciens 

25 9. SEQ ID NO: 9 Nukleinsauresequenz kodierend fiir 

Indolacetamidhydrolase {tms2) aus Agrobacterium 
tumefaciens 

10. SEQ ID NO: 10 Aminos Sure sequenz kodierend fiir 

3Q " Indolacetamidhydrolase (tms2) aus Agrobacteriim 

tumefaciens 

11. SEQ ID NO: 11 Nukleinsauresequenz kodierend fiir Haloalkan- 

dehalogenase (dhlA) aus Xanthobacter 
35 autotrophicus 

12. SEQ ID NO: 12 Amino sauresequenz kodierend fiir Haloalkan- 

dehalogenase (dhlA) aus Xanthobacter 
autotrophicus 

40 ^ 

13. SEQ ID NO: 13 Nukleinsauresequenz kodierend fur Thymxdm- 

kinase aus Herpes simplex Virus 1 

14. SEQ ID NO: 14 Amino sauresequenz kodierend fiir Thymidin- 
45 kinase aus Herpes simplex Virus 1 
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15. SEQ ID NO: 15 Nukleinsauresequenz kodierend fiir Thymidin- 

kinase aus Herpes simplex Virus 1 

16. SEQ ID NO: 16 Amino sauresequenz kodierend fiir Thymidin- 
5 kinase aus Herpes simplex Virus 1 

17. SEQ ID NO: 17 NukleinsaureseopJienz kodierend ftir Hypoxanthin- 

Xanthin-Guanin Phosphoribosyltransf erase aus 
Toxoplasma gondii 

10 

18- SEQ ID NO: 18 Amino sauresequenz kodierend fur Hypoxanthin- 

Xanthin-Guanin Phosphoribosyltransf erase aus 
Toxoplasma gondii 

15 19. SEQ ID NO: 19 Nukleinsauresequenz kodierend fiir Xanthin- 

Guanin-Phosphoribosyl transferase aus E.coli 

20. SEQ ID NO: 20 AminosSuresequenz kodierend fur Xanthin-Guanin- 

Phosphoribosyltransf erase aus E.coli 

20 

21. SEQ ID NO: 21 Nukleinsauresequenz kodierend fOr Xanthin- 

Guanin- Phosphoribosyltransf erase aus E.coli 

22. SEQ ID NO: 22 Amino sauresequenz kodierend fiir Xanthin-Guanin- 
25 Phosphoribosyltransf erase aus E.coli 

23. SEQ ID NO: 23 Nukleinsauresec[uenz kodierend fiir Purin- 

nukleosidphosphorylase (deoD) aus E.coli 

30 24- SEQ ID NO: 24 Nukleinsauresequenz kodierend fiir Purin- 

nukleosidphosphorylase (deoD) aus E.coli 

25. SEQ ID NO: 25 Nukleinsauresequenz kodierend fiir Phosphonat- 

monoesterhydrolase (pehA) aus Burkholderia 
35 caryophylli 

26. SEQ ID NO: 26 Amino sauresequenz kodierend fiir Phosphonat- 

monoesterhydrolase (pehA) aus Burkholderia 
caryophy 1 1 i 

40 

27. SEQ ID NO: 27 Nukleinsauresequenz kodierend fiir Tryptophan- 

oxygenase (a\ixl) aus Agrobacterium rhizogenes 



28- SEQ ID NO: 28 AminosSuresequenz kodierend fiir Tryptophan- 

o3cygenase (axixl) aus Agrobacterium rhizogenes 
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29. SEQ ID NO: 29 Nukleinsauresequenz kodierend fOr Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
rhizogenes 

5 30- SEQ ID NO: 30 Amino sauresequenz kodierend fiir Indol- 

acetamidhydrolase (aux2) aus Agrobacterium 
rhizogenes 

31 SEQ ID NO: 31 Nukleinsauresequenz kodierend far Tryptophan- 

oxygenase (auxl) aus Agrobacterium tumefaciens 

32. SEQ ID NO: 32 Amino sauresequenz kodierend fur Tryptophan- 
oxygenase (auxl) aus Agrobacterium tumefaciens 

15 33. SEQ ID NO: 33 Nukleinsauresequenz kodierend fur Indol- 

acetamidhydrolase {aiix2) aus Agrobacterium 
tTimef aciens 

34. SEQ ID NO: 34 Amino sauresequenz kodierend fur Indol- 

2Q ' acetamidhydrolase {aux2) aus Agrobacteriimi 

tumefaciens 

35. SEQ ID NO: 35 Nukleinsaxiresequenz kodierend fiir Indol- 

acetamidhydrolase {aux2) aus Agrobacterium 
25 vitis 

36. SEQ ID NO: 36 Aminos auresequenz kodierend fiir Indol- 

acetamidhydrolase (aTix2) aus Agrobacterium 
vitis 

30 

37. SEQ ID NO: 37 Nukleinsauresequenz kodierend fiir 5-Methyl- 

thioribosekinase (mtrK) aus Arabidopsis 
thai i ana 

35 38. SEQ ID NO: 38 Amino sauresequenz kodierend fOr 5-Mfethyl- 

thioribosekinase (mtrK) aus Arabidopsis 
thaliana 

39. SEQ ID NO: 39 Nukleinsauresequenz kodierend fiir 5-Methyl- 
4Q * thioribosekinase (mtrK) aus Klebsiella 

pneumoniae 

40. SEQ ID NO: 40 AminosSuresequenz kodierend ftir 5-Methyl- 

thioribosekinase (mtrK) aus Klebsiella 
45 pneiamoniae 
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41. SEQ ID NO: 41 Nukleinsauresequenz kodierend fiir Alkohol- 

dehydrogenase (adli) aus Arabidopsis thaliana 

42. SEQ ID NO: 42 Aminosauresequenz kodierend fiir Alkohol- 

5 dehydrogenase (adh) aus Arabidopsis thaliana 

43. SEQ ID NO: 43 Nukleinsauresequenz kodierend fUr Alkohol- 

dehydrogenase (adh) aus Hordeum vulgare 
(Gerste) 

10 

44. SEQ ID NO: 44 Aminosauresequenz kodierend fiir Alkohol- 

dehydrogenase (adh) aus Hordeum vulgare 
(Gerste) 

15 45. SEQ ID NO: 45 Nukleinsauresequenz kodierend fur Alkohol- 

dehydrogenase (adh) aus Oryza sativa (Reis) 

46. SEQ ID NO: 46 Aminosauresequenz kodierend fiir Alkohol- 

dehydrogenase (adh) aus Oryza sativa (Reis) 

20 

47. SEQ ID NO: 47 Nukleinsauresequenz kodierend fiir Alkohol- 

dehydrogenase (adh) aus Zea mays (Mais) 

48. SEQ ID NO: 48 Aminosauresequenz kodierend fiir Alkohol- 
25 dehydrogenase (adh) aus Zea mays (Mais) 

49. SEQ ID NO: 49 Nukleinsauresequenz kodierend fiir ein sense-RNA 

Fragment der Cytosindeaminase aus E.coli 
( codARNAi-sense ) 

30 

50. SEQ ID NO: 50 Oligonukleotidprimer codAS ' Hindlll 

5 ' -AAGCTTGGCTAACAGTGTCGAATAACG-3 ' 

51. SEQ ID NO: 51 Oligonukleotidprimer codAB'Sall 
35 5 ' -GTCGACGACAAAATCCCTTCCTGAGG-3 ' 

52. SEQ ID NO: 52 NukleinsSxiresequenz kodierend fiir ein 

cinti sense-RNA Fragment der Cytosindeaminase aus 
E.coli (codARNAi-anti) 

40 

53. SEQ ID NO: 53 Oligonukleotidprimer codA5'EcoRI 

5 ' -GAATTCGGCTAACAGTGTCGAATAACG-3 ' 



54. SEQ ID NO: 54 Oligonukleotidprimer codA3'BamHI 

5 ' -GGATCC(3ACAAAATCCCTTCCTGAGG-3 ' 
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55. SEQ ID NO: 55 Vektorkonstrukt pBluKS-nitP-STLSl-35S-T 

56. SEQ ID NO: 56 Expressionsvektor pSUN-1 

5 57. SEQ ID NO: 57 Transgener Expressionsvektor pSUN-l-codA-RNAi 

58 SEQ ID NO: 58 Transgener Expressionsvektor 

pSUNl-codA-RNAi-At . Act . -2-At . Als-R-ocsT 

59 SEQ ID NO: 59 Nukleinsauresequenz kodierend fiir 5-Methyl- 

' thioribosekinase (mtrK) aus Mais (Zea mays) ; 

Fragment 

60. SEQ ID NO: 60 Aminosauresequenz kodierend fiir 5-Methyl- 

thioribosekinase (mtrK) aus Mais (Zea mays) ; 
15 Fragment 

61. SEQ ID NO: 61 Nukleinsaiiresequenz kodierend fiir 5-Meth.yl- 

thioribosekinase (mtrK) aus Raps (Brassica 
napus ) , Fragment 

20 

62. SEQ ID NO: 62 Amino 3 Sure sequenz kodierend fiir 5-Metliyl- 

thioribosekinase (mtrK) aus Raps (Brassica 
napus) , Fragment 

25 63. SEQ ID NO: 63 NukleinsSuresequenz kodierend fiir 5-Methyl- 

thioribosekinase (mtrK) aus Raps (Brassica 
napus) , Fragment 

64. SEQ ID NO: 64 Aminosaureseduenz kodierend fiir 5-Methyl- 
30 ' thioribosekinase (mtrK) aus Raps (Brassica 

napus ) , Fragment 

65 SEQ ID NO: 65 NukleinsSuresequenz kodierend fiir 5-Meth.yl- 

thioribosekinase (mtrK) aus Reis (Oryza sativa) 
35 Fragment 

66 SEQ ID NO: 66 Amino sSuresequenz kodierend fiir 5-Methyl- 

thioribosekinase (mtrK) aus Reis (Oryza sativa) 
Fragment 

40 

67 SEQ ID NO: 67 NukleinsSuresequenz kodierend fiir 5-Methyl- 

thioribosekinase (mtrK) aus Soja (Glycine max) , 
Fragment 



45 
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68. SEQ ID NO: 68 Aminos auresequenz kodierend fur 5-Methyl- 

thioribosekinase (mtrK) aus Soja (Glycine max) , 
Fragment 

5 69. SEQ ID NO: 69 Oligonvikleotidprimer codA5'C-term 

5 ' -CGTGAATACGGCGTGGAGTCG-3 ' 

70. SEQ ID NO: 70 Oligonukleotidprimer codA3'C-term 

5 ' -CGGCAGGATAATCAGGTTGG-3 ' 

10 

71. SEQ ID NO: 71 Oligonukleotidprimer 35sT 5' Primer 

5 ' -GTCAACGTAACCAACCCTGC-3 ' 
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Fig.l: Inaktivierung des Markerproteingens mittels Einbringen 
einer Rekombinase 

P : Promotor 

MP: Sequenz kodierend fur ein Maxkerprotein 

R1/R2 : Rekombinase-Erkennungssequenzen 
R. Rekombinase bzw. Sequenz kodierend fiir 

Rekombinase . 

In einer bevorzugten Ausf lilirungsf orm wird die Inakti- 
vienong des Markerproteingens durch das Einbringen einer 
sequenzspezifischen Rekombinase realisiert. Bevorzugt 
wird die Rekombinase - wie hier dargestellt - ausgehend 
von einer Expressionskassette exprimiert. 

Das Markerproteingen ist von Erkennungs sequenz en fiir 
sequenzspezifische Rekombinasen flankiert, wobei durch 
Einbringen der Rekombinase Sequenzen des Markerprotein- 
gens deletiert werden und so eine Inaktivierung des 
Markerproteinsgens erf olgt . 

Fig.2-A: Inaktivierung des Markerproteingens durch Einwirken einer 
sequenzspezifischen Nuklease 

P : Promotor 

PS; Erkennxings sequenz zur gezielten Induk- 

tion von DNA-Doppelstrangbriichen 

MP-DS-MP' : Sequenz kodierend fur ein Markerprotein 
umfassend eine DS 

nDS: Inaktivierte DS 

E- Sequenzspezifisches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbruchen 

Das Markerprotein-Gen kann durch eine gezielte Mutation 
Oder Deletion im Markerprotein-Gen z.B. durch sequenz- 
spezifische Induktion von DNA-Doppelstrangbruchen an 
einer Erkennungssequenz zur gezielten Induktion von 

I DNA-Doppelstrangbriichen in oder in der NShe des Marker- 

protein-Gens (P-MP) realisiert werden. Der Doppelstrang- 
bruch kann in der kodierenden Region oder aber auch der 
nicht-kodierenden (wie beispielsweise dem Promotor) 
erfolgen, induziert eine illegitime Rekombination (nicht- 

5 homologe Verbindung von DNA-Enden; « non-homologous end- 
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joining") iind so z.B. eine Verschiebiang im Leseraster des 
Markerproteins • 

Fig.2-B: Inaktivierung des Markerproteingens durch Einwirken einer 
sequenzspezif ischen Nuklease 



p : Pr omotor 

DS: Erkennxingssequenz zur gezielten Indxik- 

tion von DNA-Doppelstrangbriichen 
MP: Sequenz kodierend fur eiri Markerprotein 

ixDS: Inaktivierte DS 

E: Sequenzspezif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbriichen 



Das Markerprotein-Gen kann durch eine gezielte Deletion 
durch sec[uenzspezif ische Induktion von mehr als einem 
sequenzspezif ischen DNA-Doppelstrangbruch in oder in 
der NShe des Markerprotein-Gens realisiert werden. Die 
Doppelstrangbriiche konnen in der kodierenden Region 
Oder aber auch der nicht -kodierenden (wie beispielsweise 
dein Promotor) erfolgen und induzieren eine Deletion im 
Markerprotein-Gen. Bevorzugt ist das Markerprotein-Gen 
von DS Seqxienzen f lankiert und wird vollstandig durch 
Einwirken des Enzyms E deletiert. 

Fig. 3: Inaktivierung des Markerprotein-Gens durch Induktion 

einer intramolekularen homologen Rekombination infolge 
des Einwirkens einer sequenzspezif ischen Nuklease 



0 A/A' : Sequenzen mit einer ausreichenden Lange 

und Homologie zueinander, um infolge des 
induzierten Doppelstrangbruches miteinander 
zu rekombinieren 
P: Promotor 
5 DS: Erkennungs sequenz zur gezielten Induktion 

von DNA-Doppelstrangbriichen 
MP: Sequenz kodierend fur ein Markerprotein 

E: Secpjenzspezif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbriichen 



Das Markerprotein-Gen kann durch eine Deletion mittels 
intramolekularen homologer Rekombination inaktiviert 
werden. Die homologe Rekombination kann durch sequenz - 
spezifische Induktion von DNA-Doppelstrangbriichen an 
einer Erkennxingssequenz zur gezielten Induktion von 
DNA- Doppelstrangbruchen in oder in der Nahe des Marker- 
protein-Gens initiiert werden. Die homologe Rekombination 
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erf olgt zwischen den Secjuenzen A \md A' , die eine aus- 
reichenden LSnge und Homologie zueinander haben, urn 
infolge des induzierten Doppelstrangbruches miteinander 
zu rekonibinieren. Die Rekombination bewirkt eine Deletion 
5 essentieller sequenzen des Markerprotein-Gens . 

Fig. 4: inaktivierung des Markerprotein-Gens durch intermole- 
kulare homologe Rekombination 

10 A/A' : Sequenzen mit einer ausreichenden Lange und Holomogie 

zueinander, miteinander zu rekombinieren 

B/B' : Sequenzen mit einer ausreichenden LSnge 

und Holomogie zueinander, vim miteinander zu 
rekombinieren 

p . Pr omotor 

J. zu insertierende Nukleinsauresequenz / 

Gen von Interesse 
MP: Sequenz kodierend fur ein Markerprotein 

Die Inaktivierung des Markerprotein-Gens (P-MP) kann auch 
durch eine gezielte Insertion in das Markerprotein-Gen 
z B mittels intermolekularer homologer Rekombination 
realisiert werden. Dabei ist die zu insertierende Region 
an ihrem 5'- und 3'-Ende von Nukleinsauresequenzen (A' 
bzw. B') flankiert, die eine ausreichende Lange und Homo- 
logie zu entsprechenden f lankierenden Sequenzen des 
Markerproteingens (A bzw. B) aufweisen, urn eine homologe 
Rekombination zwischen A und A' und B und B' zu ermSg- 
lichen. Die Rekombination bewirkt eine Deletion essen- 
30 tieller sequenzen des Markerprotein-Gens. 

Fig 5- Inaktivierung des Markerprotein-Gens durch intermole- 
kulare homologe Rekombination infolge des Einwirkens 
einer sequenzspezif ischen Nuklease 

A/ A' : Sequenzen mit einer ausreichenden Lange und 

Holomogie zueinander, um miteinander zu 
rekombinieren 
B/B' : Sequenzen mit einer ausreichenden Lange 

\ind Holomogie zueinander, um miteinander zu 
rekombinieren 
p . Promoter 

j". zu insertierende Nukleinsauresequenz / 

Gen von Interesse 
Mp. Sequenz kodierend fur ein Markerprotein 

Erkennungs sequenz zur gezielten Induktion 
von DNA-Doppelstrangbrachen 
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E: Sequenzspzif isches Enzym zur gezielten 

Induktion von DNA-Doppelstrangbriichen 



Die Inaktiviexnmg des Markerprotein-Gens kann auch durch 
eine gezielte Insertion in das Markerprotein-Gen z.B. 
mittels intermolekulcLrer homologer Rekombination reali- 
siert werden. Die homologe Rekombination kann duxcb 
secjuenzspezifische Induktion von DNA-Doppelstrangbriichen 
an einer Erkennungssequenz zur gezielten Induktion von 
DNA-DoppelstrangbrUchen in oder in der Nabe des Marker- 
protein-Gens initiiert werden. Dabei ist die zu inser- 
tierende Region an ihrem 5'- und 3'-Ende von Nuklein- 
sauresequenzen (A' bzw. B' ) flankiert/ die eine aus- 
reichende LSnge und Homologie zu entsprechenden flan- 
kierenden Sequenzen des Markerprotein-Gens (A bzw. B) 
aufweisen, um eine homologe Rekombination zwischen A und 
A' und B und B' zu errndglichen. Die Rekombination bewirkt 
eine Deletion essentieller sequenzen des Markerprotein- 
Gens . 

Fig. 6: Vektorkarte fiir pBluKS-nitP-STLSl-35S-T (SEQ ID NO: 55) 

NitP: Promotor des Nitrilasel-Gens aus A.thaliana (Gen- 
Bank Acc.-No.; ¥07648.2, Hillebrand et al . (1996) Gene 
170:197-200) 

STLS-1 Intron: Intron des ST-L.S1 Gens aus Kartoffel (Van- 
canneyt GF et al. (1990) Mol Gen Genet 220 (2) :245-250) . 

35S-Term: Terminator des 35S CaMV Gens (Blumenkohlmosaik- 
virus; Franck et al. (1980) Cell 21:285-294). 

Schnittstellen relevanter Restriktionsendonukleasen sind 
mit ihrer jeweiligen Schnittposition angegeben. 

Fig. 7: Vektorkarte fiir den transgenen Expressionsvektor 
pSUN-l-codA-RNAi (SEQ ID NO: 57) 

NitP: Promotor des Nitrilasel-Gens aus A.thaliana (Gen- 
Bank Acc.-No.: Y07648.2, Hillebrand et al. (1996) Gene 
170:197-200) 

STIiS-1 Intron: Intron des ST-LSl Gens aus Kartoffel (Van- 
canneyt GF et al. (1990) Mol Gen Genet 220 (2) :245-250) - 
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35S-Tenti: Terminator des 35S CaMV Gens (Bluinenkohlmosaik- 
virus; Franck et al. (1980) Cell 21:285-294). 

codA-sense: Nukleinsauresequenz kodierend fur ein sense- 
5 FNA Fragment der Cytosindeaminase aus E.coli (codTO^i- 

sense; SEQ ID NO: 49) 

codA-anti: Nukleinsauresequenz kodierend fur ein anti- 
sense-FNA Fragment der Cytosindeaminase aus E.coli 
10 (codARNAi-anti; SEQ ID NO: 52) 

LB/RB: Linke bzw. reclite Grenze der Agrobacterium T-DNA 

Schnittstellen relevanter Restriktionsendonukleasen sind 
15 mit ihrer jeweiligen Schnittposition angegeben. Weitere 

Elemente stellen libliche Elemente eines binaren Agro- 
bakterium-Vektors dar (aadA; ColEl; repA) 



20 



25 



Fig. 8: Vektorkarte fiir den transgenen Expressionsvektor 

pSUNl-codA-KISrAi-At.Act.-2-At-Als-R-ocsT (SEQ ID NO: 58) 

NitP: Promoter des Nitrilase I-Gens aus A.thaliana (Gen- 
Bank Acc.-No.: Y07648.2, Hillebrand et al. (1996) Gene 
170:197-200) 

STLS-1 Intron: Intron des ST-LSl Gens aus Kartoffel (Van- 
canneyt GF et al. (1990) Mol Gen Genet 220 (2) :245-250) . 



35S-Terminator: Terminator des 35S CaMV Gens (Blumenkoia- 
30 mosaikvirus; Franck et al. (1980) Cell 21:285-294). 

codA-sense: Nukleinsauresequenz kodierend fiir. ein sense- 
RNA Fragment der Cytosindeaminase aus E.coli (codARNAi- 
sense; SEQ ID NO: 49) 



35 



40 



codA-anti: Nukleinsa\iresequenz kodierend fiir ein anti- 
sense-RNA Fragment der Cytosindeaminase aus E.coli 
(codARNAi-anti; SEQ ID NO: 52) 

Left Border /Right Border: Linke bzw. rechte Grenze der 
Agrobacterium T-DNA 



Schnittstellen relevanter Restriktionsendonukleasen sind 
mit ihrer jeweiligen Schnittposition angegeben. Weitere 
45 Elemente stellen iibliche Elemente eines binaren Agro- 

bakterium-Vektors dar (aadA; ColEl; repA) 
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Fig.9a-b: Sequenzvergleicli von diversen 5-Methylthioribose (MTR) 
kinasen aus verschiedenen Organismen, insbesondere 
pflanzlichen Organismen. Gezeigt sind Sequenzen aus 
Klebsiella pneumoniae, Clostridium tetani, Arabidopsis 
5 thaliana (A.thaliana) , Raps ( Brass ica napus) , Sojabohne 

(Soy-1) , Reis ( Oryza sativa-1) sowie die Konsensus- 
sequenz (Consensus) . Homologe Bereiche konnen aus der 
Konsensussequenz leicht abgeleitet warden. 
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Allgemeine Methoden 

5 Die chemische Synthese von Oligonxikleotiden kann beispielsweise, 
in bekannter Weise, nach der Phosphoamiditmethode (Voet, Voet, 
2. Auflage, Wiley Press New York, Seite 896-897) erfolgen. Die 
im Rahmen der vorliegenden Erf indung durchgefiihrten Klonienings- 
schritte wie z.B. Restriktionsspaltungen, Agarosegelelektro- 

10 phorese, Reinigung von DNA-Fragmenten, Transfer von Nukleinsauren 
auf Nitrozellulose und Nylonmembranen, Verkniipfen von DNA-Frag- 
menten, Transformation von E. coli Zellen, Anzucht von Bakterien, 
Vermehrung von Phagen iind Sequenzanalyse rekombinanter DNA 
werden wie bei Sambrook et al. (1989) Cold Spring Harbor 

15 Laboratory Press; ISBN 0-87969-309-6 beschrieben durchgef lihrt . 
Die Sequenzierung rekombinanter DNA-Molekiile erfolgt mit einem 
Laserfluoreszenz-DNA-Sequenzierer der Firma ABI nach der Methode 
von Sanger (Sanger et al. (1977) Proc Natl Acad Sci 
USA 74:5463-5467) . 

20 

Beispiel 1: Herstellung der codA-Fragmente 

Zunachst wird eine verkiirzte und am 5' bzw. 3' Ende durch 
Addition von Erkennungssequenzen der Restriktionsenzyme Hindlll 

25 iind Sail modif izierte NukleinsSurevariante des codA Gens unter 
Verwendnng der PCR-Technologie hergestellt. Dazu wird ein Teil 
des codA Gens (GeneBank Acc.-No.: S56903; SEQ ID NO: 1) mittels 
Polymerasekettenreaktion (PGR) aus dem Herkiinf tsorganismus E.coli 
iinter Verwendung eines sense-spezif ischen Primers (codAS'Hindlll; 

30 SEQ ID NO: 50) iind eines antisense-spezif ischen Primers 
(codA3'SalI; SEQ ID NO: 51) amplif iziert . 

codAS'Hindlll: 5 ' -AAGCTTGGCTAACAGTGTCGAATAACG-3 ' (SEQ ID NO: 50) 

35 codA3'SalI: 5 ' -GTCGACGACAAAATCCCTTCCTGAGG-3 ' (SEQ ID NO: 51) 

Die PGR erfolgt in einem 50 p.1 Reaktionsansatz in dem enthalten 
sind: 

- 2 liil (200 ng)genomische DNA von E.coll 
40 - 0,2 mM dATP, dTTP, dGTP, dCTP 

1,5 mM Mg(0Ac)2 

- 5 fig RinderserTjm-Alb-umin 

40 pmol Primer ^codA5 'Hindlll" 
40 pmol Primer codA3'SalI 
45 - 15 fil 3,3x rTth DNA Polymerase XLPuffer (PE Applied 

Biosystems) 

5U rTth DNA Polymerase XL (PE Applied Biosystems) 
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Die PGR wird unter folgenden Zyklus-Bedingiangen durchgef iihrt : 



Schritt 1: 5 Minuten 94**C (Denatxirierung) 

Schritt 2: 3 Sekunden 94°C 

5 Schritt 3: 1 Minute 60*'C (Annealing) 

Schritt 4: 2 Minuten 72°C (Elongation) 

30 Wiederholungen der Schritte 2 bis 4 

10 Schritt 5: 10 Minuten 72**C (Post-Elongation) 

Schritt 6: 4°C (Warteschleif e) 

Das Amplifikat (codARNAi-sense; SEQ ID NO: 49) wird unter Ver- 
wendung von Standardmethoden in den PGR Klonieriingsvektor pGEM-T 
15 (Promega) kloniert. Die Identitat des erzeugten Amplikons wird 
durch Secjuenzierung unter Verwendung des M13F (-40) Primers 
bestatigt - 

Bin wei teres verkurztes und am 5'- bzw. 3'-Ende durch Addition 
20 von Erkennungssequenzen der Restriktionsenzyme EcoRI und BamHI 
modif iziertes Fragment des codA Gens wird mittels Polymerase- 
kettenreaktion (PGR) aus E.coli unter Verwendung eines sense- 
spezifischen Primers (codA5 ' EcoRI ; SEQ ID NO: 53) und eines 
ajitisense-spezifischen Primers (codA3 'BamHI; SEQ ID NO: 54) 
25 amplif iziert . 

codA5' EcoRI: 5 ' -GAATTGGGCTAACAGTGTCGAATAACG-3 ' (SEQ ID NO: 53) 
codA3' BamHI: 5 ' -GGATCCGACAAAATCCCTTGGTGAGG-3 ' (SEQ ID NO: 54) 

30 

Die PGR erfolgt in einem 50 |il Reaktionsansatz in dem enthalten 
sind: 

2 Jil (200 ng)genomische DNA von E.coll 
0,2 mM dATP, dTTP, dGTP, dGTP 
35 - 1, 5 mM Mg(0Ac)2 

- 5 Jig Rinder serum- Albumin 

40 pmol Primer *codA5' EcoRI" 
40 pmol Primer ''codA3 'BamHI" 

15 M.1 3,3X rTth DNA Polymerase XLPuffer (PE Applied 
40 Biosystems) 

5U rTth DNA Polymerase XL (PE Applied Biosystems) 
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Die 
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PGR wird unter folgenden Zyklus Bedingungen dvirchgef tihrt : 



5 



Schritt 1: 5 Minuten 94°C (Denaturierung) 
Schritt 2: 3 Sekunden 94°C 

Schritt 3: 1 Minute 60°C (Annealing) 

Schritt 4: 2 Minuten 72°C (Elongation) 



3 0 Wiederholungen der Schritte 2 bis 4 



10 



Schritt 5: 10 Minuten 72°C (Post-Elongation) 



Schritt 6: 4°C (Warteschleif e) 

Das Amplifikat (codARNAi-anti; SEQ ID NO: 52) wird unter Ver- 
wendung von Standardmethoden in den PGR Klonierungsvektor pGEM-T 
15 (Promega) kloniert . Die IdentitSt des erzeugten Aitiplikons wird 
durch Sequenzierung unter Verwendung des M13F (-40) Primers 
bestatigt . 

Beispiel 2 Herstellung des transgenen Expressionsverktors 
20 zur Expression einer codA doppelstrangigen RNA 

Die in Beispiel 1 generierten codA-Fragmente werden zur Her- 
stellung eines DNA Konstruktes geeignet zur Expression einer 
doppelstrangigen codA-RNA verwendet (pSUN-codA-R3SIAi) . Das 

25 Konstrukt ist geeignet zur Reduktion der RNA Fliefigleichgewichts- 
menge (RNA-stady state level) des codA Gens in transgenen 
Pf lanzen und einer daraus resultierenden Unterdriickung der 
Expression des codA Gens unter Verwendung der „ doubles trand RNA 
interference^ (dsRNAi) Technologie. Die codA RNAi Kassette wird 

30 dazu zunachst in dem Plasmid pBluKS-nitP-STLSl-3 5S-T aufgebaut 

und anschliefiend in einem weiteren Klonierungsschritt vollstandig 
in das pSUN-1 Plasmid liberfuhrt. 

Der Vektor pBluKS-nitP-STLSl-35S-T (SEQ ID NO: 55) ist ein 
35 Derivat des pBluescript KS (Stratagene) und enthalt den Promoter 
des Nitrilasel-Gens aus A.thaliana (GenBank Ace. -No.: Y07648.2, 
Nukleotide 2456 bis 4340, Hillebrand et al. (199 6) Gene 
170:197-200), das STLS-1 Intron (Vancanneyt GF et al. (1990) Mol 
Gen Genet 220 ( 2 ): 245-250 ) , Restriktionsschnittstellen die das 
40 Intron an der 5'- bzw. 3'-Seite flankieren und eine gerichtete 
Insertion von DNA Fragment en ermoglichen, sowie den Terminator 
des 35S CaMV Gens (Blumenkohlmosaikvirus ; Framck et al. (1980) 
Cell 21:285-294) . Unter Verwendung dieser Restriktionsschnitt- 
stellen (Hindlll, Sail, EcoRI, BamHI) werden die Fragmente codAR- 
45 NAi-sense (SEQ ID NO: 49) xmd codARNAi-anti (SEQ ID NO: 52) in 
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diesen Vektor inseriert, wodurch die fertige codA RNAi Kassette 
entsteht . 

Zu diesem Zweck wird ziinachst das codA-sense Fragment (codARNAi- 
5 sense SEQ ID NO: 49) unter Verwendung der Enzyme Hindlll und Sail 
aus dem pGEM-T Vektor herausgeschnitten, isoliert und in den 
pBluKS-nitP-STLSl-35S-T Vektor \inter Standardbedingungen ligiert. 
Dieser Vektor wurde im Vorfeld unter Verwendung der Restriktions- 
enzyme Hindlll und Sail geschnitten. Entsprechend positive Klone 
10 werden durch analytischen Restriktionsverdau und Sequenzierung 
identif iziert . 

Der entstandene Vektor (pBluKS-nitP-codAsense-STLSl-35S-T) wird 
unter Verwendung der Restriktionsenzyme BamHI und EcoRI verdaut. 

15 Das codA-anti Fragment (codARNAi-anti ; SEQ ID NO: 52) wird aus 
dem entsprechenden pGEM-T Vektor mit BamHI \and EcoRI her aus - 
geschnitten, isoliert und in den geschnittenen Vektor unter 
Standardbedingungen ligiert. Entsprechend positive Klone, welche 
die vollstandige codA-RNAi Kassette enthalten (pBluKS-nitP- 

20 codAsense-STLSl-codAanti-35S-T) , werden durch analytischen 
Restriktionsverdau und Sequenzierrmg identif iziert . 

Der Transfer der codA-RNAi Kassette in den pSUN-1 Vektor 
(SEQ ID NO: 56) erfolgt unter Verwendung der die Kassette 

25 flankierenden Restriktionsschnitt-stellen Sad und KpnI. Der 

entstandene Vektor pSUNl-codA-RNAi (siehe Fig, 7; SEQ ID NO: 57) 
wird zur Transformation von transgenen A.th&llana Pflanzen 
verwendet, die ein aktives codA Gen exprimieren (s.u.). Der 
Pflanzenej^ressions-Vektor pSUN-1 ist im Rahmen des erfindungs- 

30 gemaSen Verfahrens besonders geeignet, da er keinen weiteren 
positiven Selektionsmarker tragt. 

Der entstandene Vektor pSUNl -codA-RNAi ermoglicht die konsti- 
tutive Expression einer artif iziellen codA-dsRNA Variante, 

35 bestehend aus zwei identischen Nukleinsaure element en, die durch 
ein Intron getrennt, in invertierter Form zueinander vorliegen. 
In Folge der Transkription dieser artif iziellen codA-dsRNA 
Variante kommt es aufgrund der Komplementaritat der invertierten 
Nukleinsaureelemente zur Ausbildung eines doppelstrangigen RNA 

40 Molektils. Das Vorhandensein dieses Molekills induziert die Unter- 
drlickamg der Expression (RNA Akkumulation) des codA Gens mittels 
^double strand RNA interf erence* - 
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Beispiel 4: Herstelliing transgener Arabldopls thaliana Pflanzen 



Transgene Arabidopsis thaliana Pflanzen, die als Markerprotein 
das codA Gen aus E.coli transgen exprimieren ( "A. thaliana- 
5 [codA]"), warden hergestellt wie beschrieben (Kirik et al. (2000) 
EMBO J 19 (20) :5562-6) . 

Die A.tbaliana-LcodA] Pflanzen werden mit einem Agrobacterium 
tumef aciens Stamm (GV3101 [pMP90] ) auf Grundlage einer modif i- 

10 zierten Vakuuminf iltrationsmethode transf ormiert (Clough S & Bent 
A (1998) Plant J 16 ( 6) : 735-43 / Bechtold N et al. (1993) CR Acad 
Sci Paris 1144 (2) : 204-212) . Die verwendeten Agrobacterium tume- 
f aciens Zellen werden im Vorfeld mit dem beschriebenen DNA- 
Konstrukt (pSUNl-codA-RNAi) transf ormiert . Auf diese Art werden 

15 doppelt-transgene A. thaliana- [codA] Pflanzen erzeugt, die unter 
Kontrolle des konstitutiven Nitri las el -Promo tors eine arti- 
fizielle codA-doppelstrangige RNA exprimieren. Als Folge des 
durch die Anwesenheit dieser artif iziellen codA-dsRlsIA induzierten 
dsRNAi-Effektes wird die Expression des codA Gens \interdruckt . 

20 Diese doppelt-transgenen Pflanzen konnen anfgrund ihrer wieder- 
gewonnen Fahigkeit. in Anwesenheit von 5-Fluorocytosin im Kultur- 
medium zu wachsen, identif iziert werden. 

Samen der Primartransf ormanden werden auf Grimdlage der wieder- 
25 gewonnenen FShigkeit in Anwesenheit von 5-Fluorcytosin zu wachsen 
selektioniert . Zu diesem Zweck werden die Tl Samen der Primar- 
transf ormanden auf Selektionsmedium ausgelegt welches 200 [ig/ml 
5-Fluorocytosin enthalt. Diese Selektionsplatten werden unter 
Langtagbedingungen (16 Std, Licht, 21°C/8 Std. Dunkel, IB^C) inku- 
30 biert. Keimlinge, die sich in Anwesenheit von 5-Flourocytosin 
normal entwickeln, werden nach 7 Tagen separiert und auf neue 
Selektionsplatten transf eriert . Diese Platten werden bei unver- 
anderten Bedingungen fur weitere 14 inkubiert. AnschlieSend 
werden die resistenten Keimlinge in Erde pikiert vmd unter Kurz- 
35 tagbedingungen (8 Std. Licht, 21*^0/16 Std. Dunkel, 18°C) kulti- 
viert. Nach 14 Tagen werden die jungen Pflanzen in das Gewachs- 
haus transf eriert und unter Kurz tagbedingungen kultiviert. 



40 
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Beispiel 5: Herstell\mg eines Pflanzentrans format ions vektors ent- 
haltend eine Expressions-kassette zur Expression 
einer doppelstrangigen codA RNA \ind eines pf lanz- 
lichen Selektions-markers 

5 

In den pSUNl-codA-RNAi (siehe Fig. 7; SEQ ID NO: 57) wird ein 
pflanzlicher Selektionsmarker bestehend aus einer mutierten 
Variance des A.thaliana Als-Gens kodierend f\ir die Acetolactat - 
Synthase xanter Kontrolle des Promotor des A.thaliana Actin-2 Gens 

10 (Meagher RB & Williamson RE (1994) The plant cytoskeleton . 

In The Plant Cytoskeleton ( Meyer owit z , E. & Somerville, C, eds) , 
pp. 1049-1084. Cold Spring Harbor Laboratory Press, Cold Spring 
Harbor, New York) und des Terminators der Octopin- Synthase (GIE- 
LEN J et al.(1984) EMBO J 3:835-846) eingeftigt (At . Act . -2-At . Als- 

15 R-ocsT) . 

Dazu wird der Vektor pSUNl-codA-RNAi zunachst mit dem Restrikti- 
onsenzym Pvu II linearisiert . In diesen linearisierten Vektor er- 
folgt anschlieSend unter Standardbedingiingen die Ligation eines 

20 linearen DNA Fragmentes mit stiimpfen Enden, kodierend fur eine 
mutierte Variante der Acetolactat-Synthase (Als-R-Gen) . Dieses 
DNA Fragment wurde im Vorfeld der Ligation mit dem Restriktions- 
enzym Kpnl verdant iind die liberhangenden Enden durch eine Behand- 
l\ing mit der Pwo DNA-Polymerase (Roche) gemSS der Herstellervor- 

25 gaben in stumpfe Enden tiberftihrt. Diese mutierte Variante des Als 
Gens aus A.thaliana kann nicht durch Herbizide des Imidazolinon- 
Typs inhibiert werden. Durch Expression dieses mutierten A.tAls-R 
Gens erlangen die Pflanzen die Fahigkeit, in Anwesenheit des Her- 
bizides Pursiut"*" zu wachsen. Entsprechend positive Klone 

30 (pSUNl-codA-RNAi-At.Act.-2-At.Als-R-ocsT; SEQ ID NO: 57) werden 
durch analytischen Restriktionsverdau und Sequenzieriing identifi- 
ziert . 

Der entstandene Vektor ermoglicht die konstitutive Expression 
35 einer artif iziellen co6A RNA Variante (bestehend aus zwei identi- 
schen Nukleinsaureelementen, die durch ein Intron getrennt, in 
invertierter Form zueinander vorliegen) tmd einer mutierten 
Variante des A.thaliana Als-Gens. In Folge der Transkription 
dieser artif iziellen cod?^ RNA Variante kommt es aufgrund der 
40 Komplementaritat der invertierten Niikleinsaureelemente zur Aus- 
bildung eines doppelstr&cigigen RNA Molekuls. Das Vorhandensein 
dieses Molekiils induziert die Unterdruckung der Expression (RNA 
Akkumulation) des codA Gens mittels "doiible strand RNA inter- 
ference" . Die Expression des Als-R Gens vermittelt den Pflanzen 
45 die FShigkeit, in Anwesenheit von Herbiziden des imidazolinon- 
Typs zu wachsen. 
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Beispiel 6: Herstellung transgener Arabidopis thaliana Pflanzen 

Transgene Arabidopsis thaliana Pflanzen, die als Markerprotein 
das codA Gen aus E.coli exprimieren ( "A. thaliana- [codA] ") , wurden 
5 wie beschrieben (Kirik et al.(2000) EMBO J 19 (20) : 5562-6) herge- 
stellt . 

Die A. thaliana- [codA] Pflanzen warden mit einem Agrobacterium 
tumefaciens Stamm (GV3101 [pMP90] ) auf Grundlage einer modif i- 

10 zierten VakuTominfiltrationsmethode transf ormiert (Clough S & Bent 
A (1998) Plant J 16 (6) : 735-43 ; Bechtold N et al. (1993) CR Acad 
Sci Paris 1144 (2) : 204-212 ) . Die verwendeten Agrobacterium tiime- 
faciens Zellen werden im Vorfeld mit dem beschriebenen DNA-Kon- 
Strvikt .(pSUNl-COdA-RNAi-At.Act.-2-At.Als-R-ocsT; SEQ ID NO: 57) 

15 transf ormiert. Auf diese Art werden doppelttransgene A. tha- 
liana- [codA] Pflanzen erzeugt, die zusStzlich unter Kontrolle 
des konstitutiven Nitrilasel-Promotors eine artifizielle codA 
doppelstrangige RNA und eine Herbizid insensitive Variante des 
Als-Gens (Als-R) exprimieren (A. thaliana- [codA]- [codA-RNAi- 

20 At.Act.-2-At.Als-R-ocsT] ) . Als Folge des durch die Anwesenheit 
dieser artif iziellen codA-dsRNA induzierten dsRNAi-Ef f ektes wird 
die Expression des codA Gens vmterdriickt . Diese doppelttransgenen 
Pflanzen konnen aufgrund ilirer wiedergewonnen FShigkeit, in An- ^ 
wesenheit von 5-Floiirocytosin im Kulturmedium zu wachsen, identi- 

25 fiziert werden. Zusatzlich kSnnen positiv transf ormierte Pflanzen 
aufgrxmd ihrer FShigkeit, in Anwesenheit des Herbizides Pursuit 
im Kulturmedivim zu wachsen, selektioniert werden. 

Zum Zweck der Selektion werden daher die Tl Samen der Primar- 
30 trans formanden auf Selektionsmedium ausgelegt welches 100 M-g/ml 
5-Fluorocytosin enthSlt. Diese Selektionsplatten werden unter 
Langtagbedingungen (16 Std. Licht, 21''C/8 Std. Dunkel, 18°C) inku- 
biert. Keimlinge, die sich in Anwesenheit von 5-Flourocytosin 
normal entwickeln, werden nach 28 Tagen separiert xmd auf neue 
35 Selektionsplatten transf eriert . Diese Flatten werden bei unver- 
anderten Bedingtingen fiir weitere 14 Tage inkubiert. AnschlieEend 
werden die resistenten Keimlinge in Erde pikiert und unter Kurz- 
tagbedingungen (8 std. Licht, 21''C/16 Std. Dunkel, 18 °C) Iculti- 
viert. Nach weiteren 14 Tagen werden die jungen Pflanzen in das 
40 Gewachshaus transf eriert und unter Kurztagbedingungen kultiviert. 

Zusatzlich konnen Samen der Primartrans formanden - aufgrund ihrer 
Fahigkeit in Anwesenheit des Herbizides Pursiut™ zu wachsen - 
selektioniert werden. Bs ist weiterhin moglich, eine Doppel- 
45 selektion unter Verwendung des Herbizides Pursiut~ und 5-Fluor- 
cytosin im Selektionsmedium durchzuf iihren . Zu diesem Zweck werden 
die Tl Samen der Primartransf ormanden auf Selektionsmediiam ausge- 



wo 2004/013333 PCT/EP2003/007877 

86 

legt welches das Herbizid Pursuit ~ in einer Konzentration von 
100 nM enthalt (im Falle der Doppelselektion ist ebenfalls 
100 p-g/ml 5-Fluorocytosin enthalten) . Diese Selektionsplatten 
werden unter Langtagbedingungen (16 Std. Licht, 21°C/8 Std. 
5 Dunkel, 18°C) inkubiert. 

Keimlinge, die sich in Anwesenheit von Pursuit ~ (Pursiut"* und 
5-Fluorocytosin) normal entwickeln, werden nach 28 Tagen sepa- 
riert und auf neue Selektionsplatten transf eriert . Diese Flatten 

10 werden bei unverSnderten Bedingungen far weitere 14 Tage inku- 
biert. AnschlieSend werden die resistenten Keimlinge in Erde 
pikiert und unter Kurztagbedingungen (8 std. Licht, 21°C/16 Std. 
Dunkel, 18°C) kultiviert. Nach 14 Tagen werden die jungen Pflanzen 
in das Gewachshaus trans feriert und unter Kurztagbedingungen 

15 kultiviert. 

Beispiel 7: Analyse der unter Verwendung von 5-Fluorocytosin 

und/oder Pursuit selektionierten doppelttransgenen 
A.thaliana Pflanzen (A. thaliana-[codA] - [codA-RNAi- 
20 At.Act.-2-At.Als-R-ocsT] ) 

Die Integration der T-DNA Region des zur Transformation ver- 
wendeten Vektors pSUNl-codA-RNAi-A . tAls-R in die genomische DNA 
der Ausgangspflanze (A. thaliana- [codA] ) und der Verlust der codA 
25 spezifischen mRNA in diesen transgenen Pflanzen (A.thaliana- 

IcodA]-[codA-RNAi- At . Act . -2-At . Als-R-ocsT] ) kann unter Anwendung 
von Southern-Analysen und PGR Techniken bzw. Northern-Analysen 
nachgewiesen werden. 

30 Urn diese Analysen durchzufuhren wird gesamt RNA und DNA (unter 
Verwendung des RNeasy Maxi Kit (RNA) bzw. Dneasy Plant Maxi Kit 
(genomische DNA) gemaB Herstellerangaben von Qiagen) aus Blatt- 
gewebe der transgenen Pflanzen und geeigneter Kontrollen iso- 
liert. 

35 Bei den PGR Analysen kann die genomische DNA direkt als Grundlage 
(Template) der PGR verwendet werden. Die gesamt-RNA wird im 
Vorfeld der PGR in cDNA umgeschrieben. Die cDNA Synthese erfolgt 
unter Verwendung der Reversen Transkriptase Superscript II 
(Invitrogen) gemSiS der Herstellerangaben. 

40 



45 
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Beispiel 8: Nachweis der Red!Ition der codA ENA FleiEgleichge- 
wichtsmenge in den positiv selektionierten doppelt- 
transgenen Pflanzen (A.thaliana [codA] - [codA-RNAx- 
At.Act .-2-At.Als-R-ocsT] ) im Vergleich zu den zur 
Transformation verwendeten Ausgangspf lanzen (A.tha- 
liana [codA] ) durch cDNA Synthese niit anschlieBender 
PGR Amplif ikation. 



PGR Amplifikation der codA spezifischen cDNA: 
10 Die CDNA des codA Gens (AGGESSION S56903) kann unter Verwendung 
e^es sense spezifischen Primers ( codAS ' C-term SEQ ID NO: 69) und 
l^ll antisense spezifischen Primers ( codA3 ' G-term _ SEQ XD nO: 70) 
amplifiziert werden. Zu wMhlende PGR Bedmgungen smd die folgen 



den: 

15 



Die PGR erfolgte in einem 50 Jil Reaktionsansatz in dem enthalten 



ist : 



- 2nl (200ng)cDNA aus A.thaliana -[codA] bzw. A.thaliana 
[codA] - [codA-RNAi-At . Act . -2-At .Als-R-ocsT] -Pflanzen 

_ 0,2 iriM dATP, dTTP, dGTP, dCTP 
1,5 mM Mg(0Ac)2 
5 |Xg Rinderserum-Albvtmin 
40 pmol codA5' C-term SEQ ID NO: 69 
40 pmol codA3'G-term SEQ ID NO: 70 

- 15 Jil 3,3x rTth DNA Polymerase XLPuffer (PE Applied Bio- 

systems ) 

- 5U rTth DNA Polymerase XL (PE Applied Biosys terns) 

Die PGR wurde tinter folgenden Zyklus Bedingungen durchgefiihrt : 
^° Schritt 1: 5 Minuten 94'»G (Denaturierung) 
Schritt 2: 3 Sekunden 94°G 
Schritt 3: 1 Minute 56''C (Annealing) 
Schritt 4: 2 Minuten 72°C (Elongation) 
30 Wiederholungen der Schritte 2 bis 4 
Schritt 5: 10 Minuten 72''G (Post-Elongation) 
Schritt 6: A'C (Warteschleif e) 

in den positiv selektionierten Pflanzen ist die mBNA FlieS- 
Seichgewichtsmenge des codA Gens und die daraus resultierende 

*0 Snie ^CODA-Proteins derart reduziert, dass eine ^-^xtatxve 
^sLzung von 5-Fluorocytosin zu 5-Fluorouracil nxcht mehr er- 
^^lo^^ Die Folge ist, dass diese Pflanzen (im Gegensatz zu 
Sc^^ansformierten Pflanzen) in Anwesenheit von 5-Fluoro- 
c^osin wachsen kSmxen. Somit wird nachgewiesen, dass transgene 

45 pJi^^n auf grund des angewendeten Prinzips der Verhxnderung der 
S^sSon eLes negativen Selektionsmarkers identif xzxert werden 
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Beispiel 9: Nachweis der fiir die codA-RNAi kodierenden DNA unter 
Verwendung genomischer DNA der positiv selektionier- 
5 ten doppelttransgenen Pflanzen (A.thaliana 

[codA]-[codA-RNAi- At . Act . -2-At . Als-R-ocsT] ) 

Das codA-RNAi Transgen kann iinter Verwendung eines codA spezi- 
fischen Primers (z.B codA5 'Hindlll SEQ ID NO: 50) und eines 35s- 
10 Terminator spezifischen Primers amplifiziert (35sT 5' Primer SEQ 
ID NO: 71) werden. Durch Verwendiing dieser Primerkombination kann 
spezifisch nur die ftir das codA RNAi Konstrukt codierende DNA 
nachgewiesen werden, da das codA Gen, welches in den zur Trans- 
formation verwendeten Ausgangspflanz en (A.thaliana [codA]) be- 
reits vorhanden war, durch den nos-Terminator flankiert wird. 

Zu wahlende PGR Bedingungen sind die folgenden: 

Die PGR erfolgte in einem 50 Jil Reaktionsansatz in dem enthalten 



ist : 



20 



2 \ll (200ng) genomische DNA aus den A.thaliana [codA] - [codA- 
KNAi-At . Act . -2--At . Als-R-ocsT] -Pflanzen 
0,2 mM dATP, dTTP, dGTP, dGTP 
1,5 mM Mg(OAc)2 

- 5 |Llg Rinderserum-Albumin 

- 40 pmol codA spezifischer sense Primer (SEQ ID NO: 50, 53 
Oder 69) 

40 pmol 35sT 5' Primer SEQ ID NO: 71 

15 p.1 3,3x rTth DNA Polymerase XLPuffer (PE Applied Bio- 
systems) 

5U rTth DNA Polymerase XL (PE Applied Biosystems) 



30 



Die PGR wurde iinter folgenden Zyklus Bedingimgen durchgef iihrt : 

Schritt 1: 5 Minuten 94°G (Denaturierxing) 

Schritt 2: 3 Sekunden 94^*0 

Schritt 3: 1 Minute 56°G (Ttonealing) 

Schritt 4: 2 Minuten 72°G (Elongation) 

30 Wiederholungen der Schritte 2-4 

Schritt 5: 10 Minuten 72**G (Post-Elongation) 

Schritt 6: 4°C (Warteschleif e) 

40 

In den positiv selektionierten Pflanzen kann auf diesem Weg die 
Integration des codA-RNAi DNA Konstruktes in die chromosomale DNA 
der zur Transformation verwendeten Ausgangspflanz en nachgewiesen 
werden. Somit wird nachgewiesen, dass transgene Pflanzen aufgrund 
*5 des angewendeten Prinzips der Verhinderxing der Expression eines 
negativen Selektionsmarkers identif iziert werden konnen. 
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Beispiel 10: Nachweis der Reduktion der codA RNA FleiSgleich- 

gewichtsmenge in den positiv selektionierten doppelt- 
transgenen Pflanzen (A.thaliana [codA] - [codA-RNAi- 
At .Act .-2-At.Als-R-ocsT] ) im Vergleicli zu den zur 
5 Transformation verwendeten Ausgangspf lanzen (A.tha- 

liana [codA]) durch Northern-Analyse . 

Gelelektrophoretische Auftrennung von RNA: 

10 Es wird pro KNA-Agarosegel 3 g Agar in 150 ml H2O (f -c. 1,5 % 
(w/v)) in der Mikrowelle gelost und auf 50°C abgekiihlt. Durch 
Zugabe von 20 ml lOx MEN (0,2 M MOPS, 50 mM Natriumacetat , 10 mM 
EOTA) und 30 ml Formaldehyd (f .c. 2,2 M) tritt weitere Abkiihlung 
ein, so dass die gut gemischte LOsung ztigig gegossen werden muss. 
15 Formaldehyd verhindert die Bildung von Sekundarstrukturen in der 
RNA, deshalb ist die Laufgeschwindigkeit dem Molekulargewicht 
annahernd proportional (LEHRBACH H et al . (1977) Biochem J 15: 
4743-4751). Die RNA-Proben werden vor Auftrag auf das Gel in 
folgendem Ansatz denaturiert: 20 ]xl RNA (1-2 ^lg/Hl) , 5 ]Ll lOx MEN- 
Puffer, 6 M-l Formaldehyd, 20 pJ. Formamid. 

Der Ansatz wird gemischt und 10 Minuten bei 65°C inkubiert. Nach 
Zugabe von 1/10 Volumen Probenpuffer und 1 \ll Ethidiumbromid 
(10 mg/ml) wird die Probe aufgetragen. Die Gelelektrophorese 
erfolgt auf horizontalen Gelen in Ix MEN bei 120 V fiir zwei bis 
drei Stunden. Nach der Elektrophorese wird das Gel trnter UV-Licht 
unter Zuhilfenahme eines Lineals zur spSteren Fragmentlangen- 
bestimmung photographiert . Es folgt der RNA-Blot auf eine 
Nylonmeitibran gemaS der Angaben in: SAMBROOK J et al. Molecular 
cloning: A laboratory manual . Cold Spring Harbor, New York, 
Cold Spring Harbor Laboratory Press. 1989. 

Radioaktive Markierung von DNA-Fragmenten und Nothem Hybridi- 
sieirung 



20 



25 



30 



35 



Zur Markier\ing des codA cDNA Fragmentes ( codARNAi-sense SEQ ID 
No: 49) kann z.B der von Roche Diagnostics vertriebene High 
Prime Kit verwendet werden. Der "High prime" Kit basiert auf der 
von Feinberg und Vogelstein urspriinglich beschriebenen "random 
primed" Methode zur DMA Markieirung. Zur Markierung werden ca. 
*° 25 ng DNA in 9-11 P-l H20 ftLr 10 min. bei 95°C denaturiert. Nach 
kurzer Inkubation auf Eis werden 4 fil High Prime LSsung (enthalt 
eine random primer Mischung, 4 Kinheiten Klenow Polymerase und 
jeweils 0,125 mM dATP, dTTP und dGTP in einem Reaktions-Puf f er 
mit 50 % Glycerinanteil) und 3-5 Jil [a32P3dCTP (30-50 ^Ci) hinzu- 
*^ gegeben. Der Ansatz wird fiir mindestens 10 min bei 37 "C inkubiert 
und das nicht eingebaute dCTP anschlieSend von der nunmehr radio- 
aktiv markierten DNA durch Gelf iltration iiber eine Sephadex 
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G-50-Saule getrennt. Anschliefiend wird das Fragment 10 min bei 
95^C denaturiert \md bis zur Verwendung auf Eis gehalten. Es 
warden folgende Hybridisierungs- und Vorinlcubationspuf f er be- 
nutzt : 

5 

Hypo Hybond 

250 mM Natriumphosphat-Puffer pH 7,2 
1 mM EDTA 
7 % SDS (g/v) 
10 250 mM NaCl 

10 |Xg/ml ssDNA 

5 % Polyethylenglykol (PEG) 6000 
40 % Formamld 

15 Bei Verwendung von Hypo Hybond betrSgt die Hybridisieriings- 

temperatur 42°C, die Hybridisiearungsdauer 16-24 Std. Zum Waschen 
der RNA-Filter werden drei verschiedene Ldsungen verwendet 2 x 
SSC (300 mM NaCl; 30 mM NaCitrat) + 0,1% SDS, 1 x SSC + 0 , 1 % SDS 
land 0,1 X SSC + 0,1 % SDS. Die L^nge und Intensitat des Waschens 

20 richtet sich nach der Starke der gebundenen Aktivitat. Im An- 
schluss an das Waschen werden die Filter in Plastikfolie ein- 
geschweiSt \jnd ein Rontgenfilm (X-OMat, Kodak) bei -70 Bc iiber 
Nacht exponiert. Die Signalstarke auf den Rontgenf ilmen ist ein 
MaS fiir die Menge der codA mRNA MolekQle in der auf den Membranen 

25 gebundenen gesamt RNA. In den positiv selektionierten Pflanzen 
kann somit die Reduktion der codA mRNA im Vergleich zu den zur 
Transformation verwendeten Ausgan.gspf lanzen nachgewiesen werden. 

In den positiv selektionierten Pflanzen ist die mRNA FlieS- 
30 gleichgewichtsmenge des codA Gens und die resultierende Menge 
an gebildeten CODA-Proteins derart reduziert, dass eine quanti- 
tative UmsetzTing von 5-Fluorocytosin zu 5-Fluorouracil nicht 
mehr erfolgen ksuin. Die Folge ist, dass diese Pflanzen (im Gegen- 
satz zu den nicht trans formier ten Pflanzen) in Anwesenheit von 
35 5-Fluorocytosin wachsen konnen. Somit wird nachgewiesen, dass 
transgene Pflanzen aufgrund des angewendeten Prinzips der Ver- 
hinderxing der Expression eines negativen Selektionsmarkers iden- 
tifiziert werden kdnnen. 

40 Beispiel 11: Zusammenfassung der Ergebnisse der «Negativ-Negativ*' 
Selektion 

Die Transformation der codA-transgenen Arabidopsis Pflanzen mit 
dem codA-dsRNA Konstrukt (pSUNl-codA-RNAi-At .Act.-2-At .Als- 
45 R-ocsT; SEQ ID NO: 57) fuhrt sowohl bei der Einf ach-Selektion 
(nut mit 5-Fluorcytosin) als auch bei der Doppel-Selektion 
(Pursiut^ und 5-Fluorcytosin) zu einer signifikant erhohten 
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Anzahl von doppelt-transgene Pflanzen, die das KNAi-Konstrukt 
erfolgreich in das Genom integriert haben (jeweils iiti Vergleich 
zu nicht trans formier ten Pflanzen) . Die Analyse mittels PGR 
(s-o.) bestatigt bei der Mehrzahl der so generierten Pflanzen 
5 den doppelt transgenen Status. Damit kann erfolgreich die Prakti- 
kabilitat der vorliegenden Erfindiing d.h. die Nutzbarkeit der 
Repression eines negativen Markers zur positiven Selektion (quasi 
eine "negativ-negativ" Selektion) gezeigt werden, 

10 



15 



20 



25 



30 



35 



40 



45 
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Patentansprtiche 

1. Verfahren zur Herstellung trans formierter pf lanzlicher Zellen 
5 Oder Organismen \amfassend nachfolgende Schritte: 

a) Transformation einer Population pf lanzlicher Zellen, 
wobei die Zellen besagter Population mindestens ein 
Markerprotein enthalten, das fiir besagte Population 

10 direkt oder indirekt einen toxischen Ef f ekt * bewirken 

kann, mit mindestens einer zu insertierenden Nuklein- 
sauresequenz in Kombination mit mindestens einer Ver- 
bindung befahigt zur Verminderung der Expression, Menge, 
Aktivitat und/oder Fxinktion mindestens eines Marker- 

15 proteins , und 

b) Selektion von trans formier ten pflanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufweisen und die 
inf olge der Wirkung besagter Verbindung gegeniiber nicht- 

20 trans formiert en Zellen einen Wachstumsvorteil haben, 

aus besagter Population pf lanzlicher Zellen, wobei die 
Selektion \anter Bedingungen durchgefahrt wird, bei denen 
das Markerprotein seinen toxischen Effekt auf die nicht- 
trajisf ormierten Zellen ausiiben kann. 

25 

2. Verfahren nach Anspruch 1, wobei das Markerprotein in der 
Lage ist, eine fur besagte Population pf lanzlicher Zellen 
nicht-toxische Substanz X in eine fur besagte Population 
toxische Sxabstanz Y direkt oder indirekt umzusetzen, 

30 umfassend nachfolgende Schritte: 

a) Trajis formation der Population pflanzlicher Zellen mit 
mindestens einer zu insertierenden Nukleinsauresequenz in 
Kombination mit mindestens einer Verbindung befahigt zur 

35 Verminderung der Expression, Menge, Aktivitat und/oder 

Funktion mindestens eines Markerproteins , und 

b) Behandlung besagter Population pflanzlicher Zellen mit 
der Sxibstanz X in einer Konzentration, die infolge der 

40 Ifaisetzung durch das Markerprotein einen ftlr nicht-trsms- 

formierte Zellen toxischen Effekt bedingt, und 

c) Selektion von trans fonaier ten pflanzlichen Zellen, die in 
ihrem Genom besagte Nukleinsauresequenz aufweisen und die 

45 infolge der Wirkxing besagter Verbind\ing gegeniiber nicht- 

trans formiert en Zellen einen Wachstumsvorteil haben, 
aus besagter Population pflanzlicher Zellen, wobei die 
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Selektion unter Bedingungen diirchgefuhrt wird, bei denen 
das Markerprotein seinen toxischen Effekt auf die nicht- 
transf ormierten Zellen ausiiben kann. 

3 . Verf ahren nach Anspruch. 2 , wobei es sich bei der nicht- 
toxischen Siabstanz X im eine Substanz handelt, die nattir- 
licherweise in pflanz lichen Zellen oder Organismen nicht oder 
nur in Konzentration vorkommt, die im wesentlichen keinen 
toxischen Effekt bewirken konnen. 

4. Verf ahren nach Anspruch 2 oder 3, wobei es sich bei der 
Substanz X urn eine Stibstanz handelt ausgewahlt aus der Gruppe 
bestehend aus Pro-Herbiziden, Pro-Antibiotika, Nukleosid- 
analoga , 5-Fluor ocy tos in , Aioxinamidverbindiingen , Naphthal- 
acetamid, Dihaloalkanen, Acyclovir, Ganciclovir, l,2-Deoxy-2- 
fluoro-p-D-arabinofuranosil-5-iodouracil, 6-Thioxanthin, 
Allopurinol , 6-Methylpurindeoxyribonukleosid , 4-Amino- 
pyrazolopyrimidin, 2-Amino-4-methoxy-butansaure , 5- (Tri- 

f luoromethyl) thioribose und Allylalkohol . 

5. Verf ahren nach einem der Anspriiche 1 bis 4, wobei das Marker- 
protein ausgewahlt ist aus der Gruppe bestehend aus Cytosin- 
deaminasen, Cytochrom P-450 Enyzmen, Indolessigsaurehydro- 
lasen, Haloalkandehalogenasen, Thymidinkinasen, Guaninphos- 
phoribosyltransferasen, Hypoxanthinphosphor ibosyl trans - 

f erasen , Xanthinguaninphosphoribosyl trans f erasen , Pur in- 
nukleosidphosphorylasen, Phosphonatmonoesterhydrolasen, 
Indolacetamidsynthasen , Indolacetamidhydrolasen , Adenin- 
phosphoribosyltransf erasen, Methoxinindehydrogenasen, 
Rhizobitoxinsynthasen, 5-Methylthioribosekinasen xmd Alkohol- 
dehydrogenasen . 

6. Verf ahren nach einem der Ansprtiche 1 bis 5/ wobei das Marker- 
protein kodiert wird durch 

a) eine Seguenz beschrieben durch die GenBank Accession- 
Nummer S56903, M32238, NC003308, AE009419, AB016260, 
NC002147 M26950, J02224, V00470, V00467, U10247, M13422, 
X00221, M60917, U44852, M61151, AF039169, AB025110, 
AF212863, AC079674, X77943, M12196, AF172282, X04049 
Oder AF253472 

b) eine Sequenz gemaS SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 
18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 
46 Oder 48 



wo 2004/013333 PCT/EP2003/007877 

94 

7. Verfahren nach einem der Anspriiclie 1 bis S, wobei die Ver- 
bindiang befahigt zur Verminderung der Expression, Menge, 
Aktivitat imd/oder Funktion mindestens eines IXEarkerproteins 
mindestens eine Nukleinsauresequenz , Riboniikleinsauresequenz, 

5 doppelstrangige Ribonukleinsauresequenz , antisense-Ribo- 

nukleinsauresequenz , Esqpressionskassette oder Polypeptid- 
s equenz \aiaf as s t . 

8. Verfahren nach einem der Anspriiche 1 bis 7, wobei die 

10 Verbindung befahigt zur Verminderung der Expression, Menge, 

Aktivitat und/oder Funktion mindestens eines Markerproteins 
ein DNA-Konstrukt ist, welches umfasst 

a) mindestens eine Express ionskas set te geeignet zur 
15 Expression einer Ribonukleinsauresequenz und/oder 

gegebenenfalls eines Proteins, wobei besagte Nuklein- 
sauresequenz und/oder Protein in der Lage ist, die 
Expression, Menge, Aktivitat und/oder F\inktion des 
Markerproteins zu vermindem, oder 

20 

b) mindestens eine Sequenz, die eine teilweise oder voll- 
standige Deletion oder Inversion der Sequenz kodierend 
fur besagtes Markerprotein bewirkt und so eine Ver- 
mindenang der Expression, Menge, Aktivitat und/oder 

25 Funktion des Markerproteins ermSglicht, sowie 

- gegebenenfalls - weitere Fiinktionselemente, die 
besagte Deletion oder Inversion erleichtern und/oder 
f ordem , oder 

30 c) mindestens eine Sequenz, die eine Insertion in die 

Sequenz kodierend fur das Markerprotein bewirkt und 
so eine Verminderiing der Expression, Menge, Aktivitat 
und/oder Funktion des Markerproteins ermoglicht, sowie 

- gegebenenfalls - weitere Funktionselemente, die besagte 
35 Insertion erleichtern und/oder f ordem. 

9. Verfahren nach einem der Anspriiche 1 bis 8, wobei die Ver- 
minderung der Expression, Menge, Aktivitat und/oder Funktion 
des Markerproteins durch mindestens eines der nachf olgenden 
40 Verfahren realisiert wird 

a) Einbringen mindestens einer doppelstrangigen Marker- 
protein Ribonukleinsauresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette oder 
4 5 Expr es s ionskas set ten . 
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b) Einbringen laindestens einer Markerprotein antisense-Ribo- 
nukleinsauresequenzen oder einer deren Expression gewSlir- 
leistenden Expressionskassette. 

5 c) Einbringen mindestens einer Markerprotein antisense-Ribo- 

nukleinsSuresequenze kombiniert mit einem Ribozym oder 
einer deren Expression gewahrleistenden Expressions- 
kassette oder Expressionskassetten. 

10 d) Einbringen mindestens einer Markerprotein sense-Ribo- 

nukleinsauresequenzen zur Induktion einer Kosuppression 
Oder einer deren Expression gewahrleistenden Expressions- 
kassette. 

15 e) Einbringen mindestens eines DNA-oder Protein-bindenden 

Faktors gegen ein Markerprotein-Gen, -RNA oder -Protein 
Oder einer dessen Expression gewahrleistenden 
Expressionskassette . 

20 f ) Einbringen mindestens einer den Markerprotein RNA-Abbau 

bewirkenden viralen NukleinsSLuresequenz oder einer deren 
Expression gewahrleistenden Expressionskassette. 

g) Einbringen mindestens eines Konstruktes zur Erzeug\mg 
25 einer Insertion, Deletion, Inversion oder Mutation in 

einem Markerprotein-Gen . 

10. Verfahren nach einem der Anspruche 1 bis 9, wobei die Inakti- 
vierung des Markerprotein-Gens durch. das Einbringen einer 

30 sequenzspezif iscben Rekombinase realisiert wird. 

11. Verfahren nach einem der Anspruche 1 bis 9, wobei die Inakti- 
vierung des Markerprotein-Gens durch das Einbringen eines 
sequenzspezif ischen Enzyms geeignet zur Induktion von DNA- 

35 Doppelstrajigbriichen realisiert wird. 

12. Verfahren nach einem der Anspruche 1 bis 11, wobei die 
Inaktivierung des Markerprotein-Gens durch Induktion einer 
intramolekularen oder intermolekularen homologen Rekombi- 

40 nation realisiert wird. 



13. Verfahren nach Anspruch 12, wobei die homologe Rekombination 
durch Einwirkung eines sequenzspezif ischen Enzyms geeignet 
zur Induktion von DNA-Doppelstrcmgbriichen gefordert wird. 
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14. Verfahren nach nach einem der Anspriiche 1 bis 13, wobei die 

Inaktivierxang des Markerproteins durch Integration einer DNA- 
Sequenz in ein Markerprotein-Gen realisiert wird, lamfassend 
nachfolgende Schritte: 

5 

i) Einbringen eines Insertionskonstruktes iind mindestens 
eines Enzyms geeignet zur Induktion von DNA-Doppel- 
strangbruchen an einer Erkennungssequenz zur gezielten 
Induktion von DNA-Doppelstrangbrttchen in oder in der Nahe 

10 des Markerprotein-Gens, und 

ii) Induktion von DNA-Doppelstrangbruchen an den Erkennungs- 
sequenzen zur gezielten Induktion von DNA-Doppelstrang- 
briichen in oder in der NShe des Markerprotein-Gens , und 



15 



iii) Insertion des Insertionskonstruktes in das Markerprotein- 
Gen, wobei die Funktionalitat des Markerprotein-Gens und 
- bevorzugt - die Funktionalitat der Erkennungssequenz 
zur gezielten Induktion von DNA~Doppelstrangbr\ichen 
20 inaktiviert wird, so dass besagte Erkennungssequenz 

nicht mehr durch das Enzym geeignet zur Induktion von 
DNA-Doppelstrangbrtlchen geschnitten werden kann, und 

iV) Selektion von Pflanzen oder pflanzlichen Zellen, bei 
25 denen das Insertionskonstrukt in das Markerproteingen 

insertiert wurde. 

15. Verfahren nach einem der Anspruche 11, 13 oder 14, wobei 
das sequenzspezifische Enzym geeignet zur Induktion von DNA- 

30 Doppelstrangbrtichen eine Homing-Endonuklease ist. 

16. Verfahren nach einem der Anspruche 1 bis 15, wobei zusammen 
mit der zu insertierenden NukleinsSuresequenz eine Sequenz 
kodierend fiir eine Resistenz gegen mindestens ein Toxin, 

35 Antibiotikum oder Herbizid eingebracht wird, und die 

Selektion zusatzlich unter Einsatz des Toxins, Antibiotikums 
Oder Herbizids erfolgt. 



17. Verfahren nach einem der 2tospr\iche 1 bis 16, wobei die 

in das Genom der pflanzlichen Zelle oder des pflanzlichen 
Organismus zu insertierende Nukleinsauxesequenz mindestens 
eine Expressionskassette umfasst, wobei besagte Expressions- 
kassette unter Kontrolle eines in pflanzlichen Zellen oder 
pflanzlichen Organismen funktionellen Promoters eine RNA 
und/oder ein Protein exprimieren kann, welche nicht die Ver- 
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minderung der Expression, Menge, Aktivitat und/oder Fimktion 
eines Markerproteins bewirken. 

18. Verfahren nach einem der Anspriiclie 1 bis 17, wobei die 
pflanzlicbe Zelle Teil eines pflanzlichen Organisitius oder 
eines davon abgeleiteten Gewebes, Teils, Organs, Zellkultur 
Oder Vermebnmgsmaterials ist. 

19 . verfahren nach einem der Anspriiche 1 bis 18 zur Herstellung 
transformierter pflanzlicher Zellen oder Organismen, , 
lutifassend nachfolgende Schritte: 

a) Transformation einer Population pflanzlicher Zellen, 
welche mindestens ein nicht-endogenes (bevorzugt nicht- 
pflanzliches) Markerprotein iimfasst, das in der Lage 
ist, eine fur besagte Popiilation pflanzlicher Zellen 
nicht-toxische Siibstanz X in eine fiir besagte Population 
toxische Substanz Y direkt oder indirekt umzusetzen, mit 
mindestens einer zu insertierenden Nukleinsauresequenz in 
Kombination mit mindestens einer Nukjleinsauresequenz 
kodierend ftir eine Ribonukleinsauresequenz befahigt zur 
Verminderung der Expression, Menge, Aktivitat und/oder 
Fianktion besagten Markerproteins , und 

b) Behandlung besagter Population pflanzlicher Zellen mit 
der Substanz X in einer Konzentration, die infolge der 
Uiasetzung durch das Markerprotein einen fiir nicht-trans- 
formierte Zellen toxischen Effekt bedingt, xmd 

c) Selektion von trans formier ten pflanzlichen Zellen 
(und/oder Populationen pflanzlicher Zellen wie pflanz- 
lichen Geweben oder Pf lanzen) , die in ihrem Genom besagte 
Nukleinsauresequenz aufweisen und die infolge der Wirkung 
besagter Verbindung gegenuber nicht-trans formier ten 
Zellen einen Wachstumsvorteil haben, aus besagter Popu- 
lation pflanzlicher Zellen, wobei die Selektion unter 
Bedingungen d\irchgef uhrt wird, bei denen das Marker- 
protein seinen toxischen Effekt auf die nicht- trans- 
formierten Zellen ausuben kann, und 



d) 



Regeneration von fertilen Pf lanzen, und 



e) Auskreuzung der fiir das Markerprotein kodierenden 

Nukleinsauresequenz und Isolation von fertilen Pf lanzen, 
die in ihrem Genom besagte Nukleinsauresequenz aber nicht 
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mehr die fiir das Markerprotein kodierende Sequenz auf- 
welsen. 

20. Aminosauresequenzen kodieren fiir eine pflanzliche 5-Methyl- 
thioribosekinase. dadurch gekennzeichnet, dass besagte Amino- 
saureseguenz mindestens eine Seguenz enthalt ausgewahlt aus 
der Gruppe bestehend aus SBQ ID NO: 60. 62, 64, 66 oder 68. 

21. Nukleinsauresequenz kodieren fiir eine pflanzliche 5-Methyl- 
thioribosekinase, dadurch gekennzeichnet, dass besagte 
Nukleinsaiiresequenz mindestens eine Sequenz enthait aus- 
gewShlt aus der Gruppe bestehend aus SEQ ID NO: 59,. 61, 63, 
65 Oder 67. 

22. Doppelstrangiges RNA-MolekUl ximfassend 

a) einen " sense "-RNA-Strang \imfassend mindestens eine Ribo- 
niikleotidsequenz, die im wesentlichen identisch ist zu 
mindestens einem Teil des «sense"-HNA-Transkriptes einer 
Niikleinsauresequenz kodierend fiir ein Markerprotein, und 

b) einen «antisense--KNA-Strang, der zu dem RNA-sense-Strang 
unter a) im wesentlichen - bevorzugt vollstandig - 
komplementaren ist. 

23. Doppelstrangiges PNA-Molekiil nach Anspruch 22, wobei das 
Markerprotein wie in einem der Anspriiche 2 bis 6 def iniert 
ist. 

24. Doppelstrangiges RNA-Molekul nach einem der Anspriiche 22 
Oder 23, wobei » sens e'-RNA-St rang \ind "antisense'-RNA-Strang 
kovalent in Form eines invertierten Repeats miteinander ver- 
bunden sind. 

25. Transgene Expressionskassette enthaltend in funktioneller 
Verkniipfung mit einem in pflanzlichen Organismen funktio- 
nellen Promoter eine Nukleinsauresequenz kodierend fiir ein 
doppelstrangiges RNA-Molek(il gemaS einem der Anspriiche 22 
bis 24. 

26. Transgene Ejcpressionskassette enthaltend eine Nukleinsaure- 
sequenz kodierend fiir zumindest einen Teil eines Marker- 
proteins, wobei besagte Nukleinsauresequenz mit einem in 
pflanzlichen Organismen funktionellen Promoter in antisense- 
Orientierung funktionell verknUpft ist. 
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27. Transgene Expressionskassette nach Anspruch 26, wobei das 
Markerprotein wie in einem der Anspriiche 2 bis 6 def iniert 
ist . 

5 28. Transgener Vektor enthaltend eine transgene Expressions- 
kassette gemaS einem der Anspriiche 25 bis 27. 

29. Transgener pflanzlicher Organismus enthaltend ein doppel- 

strangiges RNA-Molekiil gemaS einem der Anspriiche 22 bis 24, 
10 eine transgene Expressionskassette gemSfi einem der 

Anspriiche 25 bis 27 oder einen transgenen Vektor geitiaS 
Anspruch 28 . 

30 Transgener pflanzlicher Organismus nach Anspruch 29, aus- 
15 ' gewahlt aus der Gruppe der Pflanzen bestehend aus Weizen. 

Hafer, Hirse, Gerste, Roggen, Mais, Reis, Buchweizen, 
Sorghum, Triticale, Dinkel, Leinsamen. Zuckerrohr, Raps, 
Kresse. Arabidopsis. Kohlarten, Soja, Alfalfa, Erbse. Bohnen- 
gewachsen, Erdnuss, Kartoffel, Tabak, Tomate, Aubergine, 
20 Paprika, Sonnenblume. Tagetes, Salat, Calendula, Melone, 

Kiirbis \md Zucchini. 

31 Gewebe, Organ, Teil, Zelle, Zellkultur oder Vermehrungsgut 
abgeleitet von einem transgenen pf lanzlichen Organismus gemafi 

25 einem der Anspriiche 29 oder 30. 



30 



35 



40 



45 



wo 2004/013333 



PCT/EP2003/007877 



1/11 




R1/R^ 



Fig. 1 



wo 2004/013333 



PCT/EP2003/007877 



2/11 



MP 



DS 



MP 




(J) 



MB 


nDS 


pnDS 


MP! 




nDS- 



nDS MP 



Fig. 2-A 



wo 2004/013333 PCT/EP2003/007877 

3/11 



nDS- nDS- 



Fig. 2-B 



wo 2004/013333 



4/11 



PCT/EP2003/007877 




Fig. 3 



wo 2004/013333 



5/11 



PCT/EP2003/007877 



— [fe>|M^- r~B 





Fig. 4 



wo 2004/013333 PCT/EP2003/007877 

6/11 




Fig. 5 



wo 2004/013333 



7/11 



PCT/EP2003/007877 



35S-Term 



EcoRI (4918) 

\ 
\ 

N 

\ 

BamHI (490^;^ 

Int 

Sal I (4703) 



StLS^ Introh^ 



Hindlll (4694) 



NitP 



Kpnl (1) 




Sac I (2857) 



Fig. 6 



wo 2004/013333 PCT/EP2003/007877 

8/11 



NitP 



Hindlll (7994) 

codA Sen^e 

Sal I (7495j 
STLSl IntrdiT 
cod A Anti 

EcoRI (6790^ 
35S-TeriTi 

Kpnl (6041) 

Sal I (5996^ 
Hindlll 



Sac! (1) 
/ecoRI(3) 





-1-codA RNA 

9838 bp 




ColE1 



repA 



aadA 



Fig. 7 



wo 2004/013333 



9/11 



PCT/EP2003/007877 



3'OCS 



AtAHAS 
£ccRI (12314) 



Left Border 



Eco RI (10983) 
AtAct2-Promotor"" 

£coRI(9912) 



A.t Nitrilase-1 Promoter 

Sail (7984) 




CodA Antisense 

Sail (7467) 



repA 



C0IEI 



aadA 
Right Border 

SaU(5962) 

CaMV 35S Terminator 
\ EcdRl (6755) 
CodAsense l-lindiil/Sall 



pSUN1-coclA-RNAi-/\f.>Acf.-2->4f./\/s-fl-ocsT 



Fig. 8 



wo 2004/013333 



PCT/EP2003/007877 



10/11 



Klebsiella pneumoniae 
Clostridium tetani . 
Zea mays 
A. thaliana 
Brassica napus-2 
Soy-1 

Oryza sativa-1 
Consensus 



Klebsiella pneumoniae 
Clostridium tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



Klebsiella pneumoniae 
Clostridium tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 
sativa -1 
Consensus 



Klebsiella pneumoniae 
Clostridium tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



Klebsiella pneumoniae 
Clostridium tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



1 50 

(X) MSQYHTFTAHDAVAYAQQ 

(1) MSRFDSHFRMETEDAILYAKE 

{ 1 ) ARALIiSSPLAGASPDCQSASAMAAEEEQGFRPIiDESSLLAYIKATPALAS 

(1) MSFEEFTPIiNEKSLVBYIKSTPALSS 

( 1 ) VDDFVIiRAKEMSFDEFKPLNEKSLVEYIKATPALSS 

(1) • 

(1) 

(1) L V A 

51 100 

(19) FAGIDNPSELVS AQEVGDGNLNLVFKVFDRQGVSRAIVKQAliPYVRCVGE 

( 22 ) KLGIFDEHAKLQAEEIGDGNINYVFKVWDVOT^KSVIIKHADIFLRSSGR 

(51) RLGGGGSLDS1EIKEVGDG3>3LNFVYIVQSEAGA — IWKQALPYVRCVGD 

{21) KIGADKSDDDLVIKEVGDGNLNFVFIWGSSGS-*-LVIKQAIiPYIRCIGE 

(37) RX.GDKY — DDLVIKEVGDGNLNFVFIWGSTGS — LVIKQAliPYIRCIGE 

(1) 

(1) 

(51) KLG D II EVGDGNLNFVF V G LVIKQAliPYIRCIGE 

101 150 
( 69 ) SWPIjTLDRARLEAQTLVAHYQHSPQHTVKIHHFDPELAVMVMEDLS-DHR 
(72) — ELDVDRmiEAEVIiMLQGILAPGIiVPKVYKYDSVMClSII»SMEDIS-DHR 
(99) SWPiymiERAYFEASTLREHGRLCPEHTPEVYHFDRTLSL,MGMRYIEPPHI 
(75) SWPMTKERAYFEATTLRKHGNLSPDHVPEVYHFDRTMAIilGMRYIiEPPHI 
( 83 ) SWPMTKERAYFEATTLRKHGCaiSPDHVPEVYHFDRTMALIGMRYIiEPPHI 

( 1 ) IPEHVPEVYHFDRTMSIilGMRYIiEPPHI 

^1) 

(101) SWPMT ERA EA TL HG LSPDHVPEVYHFDRTMAXiIGMRYLEPPHI 

151 200 

(118) IWRGELIANVYYPQAARQIiGDYIiAQVLFH'rSDF YLHPHEKKAQVAQFIW- 

( 119 ) NLRKELLKRJSTTFPSFAEHITTFIVimjIiPTTDLViynDS 
(149) ILRKGLVAGVEYPIiLADHMSDYMAKTIiFFTSLLYNNTTDH^ 

(125) IliRKGLIAGIEYPFLADHMSDYMAKTIiFFTSLIiYHDTTEHRRAVTEFCGN 

(133) IliRKG 

(29) IlilKGIilAGIEYPFLAEHMADFMAKTIiFFTSLIjFRSTADHKRDVAEFCGN 

(1) LLYNSTTDHKKGVAQYCDN 

(151) IliRKGLIA I YP ADHM DYMA TLF TSLLY T DHK VA F N 

201 250 

(167) PAMCEITEDLFFNDPYQIHERN — KYPAELEADVAAXiRDDAQIjKIjAVAAL 

(168) KDIiCKISEDLVPTEPFIDYKSRlsITVLEENIEFVKRQIiYEDKEI/IIiEAGKI. 
{ 199 ) VEMCRLTEQWFSDPYRVSKFlSIR-WTSPYLDKDAEAVREDDErjKIjEVAGri 
(175) VELCRIjTEQWFSDPYRVSTFlSIR--WTSPYL.DDDAKAVREDSALiKIiEI AEL 

(138) 

(79) VELCRLTEQWFSDPYKVSQYNR- WTS PYIiDRDAEAVREDNLLKLjEVAEIi 

(20) VEMCRLTEQNA^SDPYMIiAKYm-CTSPFIiDNDAAAVREDAEIiKIjEI AEIi 

(201) VELCRLTEQWFSDPY VS FNR TSPYLD DA AVRED LKIiEVA L 



Fig, 9a 



wo 2004/013333 PCT/EP2003/007877 

11/11 



251 

Klebsiella pneijinoniae 
Clostridium tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 

Klebsiella pneumoniae 
Clostridium teteuai. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



Klebsiella pneiimoniae 
Clostridixim tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



Klebsiella pneiimoniae 
Clostridiiim tetani. 
Zea mays 
A. thaliana 
Brassica napus -2 
Soy -1 

Oryza sativa -1 
Consensus 



300 

(215 ) KHRPFAHAEALLHGDIHSGSIFVAEGSLKAIDAEFGYFGPXGFDIGTAIG 

( 218 ) KNNFMNNSQALIHGDLHSGSIFVNEESTKIIiDPEFAFYGPIGYDLGNVIG 

(248) KSMFIERAQALIHGDLHTGSIMVTEVQLKSIilQNLGSMGPMGFDIGSLPW 

(224) KSMPCERAQALIHGDLHTGSVMVTQDSTQVIDPEFSFYGPMGFDIGAYLG 

(138) 

(128) KSKFIES 

( 69 ) KSMFIERAQALLHGDLHTGSIMVTPDSTQVIDPEFAFYGPMGYDIGAFIiG 

(251) KS FIE AQALIHGDLHTGSI V S ID EFAFYGPMGFDIG IG 

301 350 
(265) NLLLNYCGIiPGQLGIRDAAAAREQRLNDIHQIjWTTF AERFQALAAEKTRD 
(268) NliFFAWANAYVTEDGKEVEEFTIWIEKTIENIIiEIiFKEKFIKKYKEIVTD 

(298) KPDFGHIMHRMGMLIKRMIVRIjTRMDIjEDN 

( 274 ) NLILAFFAQIX3HATQEOT)RKEYKQWILRTIEQTWNLFNKRFIALWDQI^ 

(138) 

(135) 

(119) NLIIiAYFSQDGHADQANDRKAY 

(301) NI* AY 

351 400 
(315) AAIiAYPGYASAFLKKVWADAVGFCGSELIRRSVGLSHVADIDTIQDDAMR 
(318) VMAKEEYYMNWYIiHS ILSDTAGQVGIiEI IRRWGDSKVLDITSITDINKR 

(328) 

(324) GPGEAYIiADIYNlSrrEVIiKFVQElTraRNXiIjHDSLGFGT^^ 

(138) 

(135) 

(141) 

(351) 

401 447 

(365) HECLRHAITLGRALIVLAERIDSVDEIiliARVRQYS 

(368) VKAERILILSAKTFIKNRHKIKTGKRYVEIFNS1®1Y 

(328) 

(374) EDFESIEEDKRRAICERSALEFAKMLLKERRKFKSIGEWSAIQQQS 

(138) 

(135) 

(141) 

(401) 



Fig. 9b 



wo 2004/013333 



1 



PCT/EP2003/007877 



SEQUENZPROTOKOLIi 

<110> BASF Plant Science GmbH 

<120> Neue Selektionssysteme 

<130> PF53790-AT 

<140> 
<141> 

<160> 71 

<170> Patentin Ver. 2.1 

<210> 1 
<211> 1284 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 
<222> (1)..(1281) 

<223> coding for cytosine deaminase (codA) 
<400> 1 

gtg teg aat aac get tta caa aca att att aac gcc egg tta cca ggc 
val Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 

15 10 15 

gaa gag ggg ctg tgg cag att cat ctg cag gac gga aaa ate age gcc 
Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 

20 25 30 

att gat gcg caa tec ggc gtg atg ecc ata act gaa aac age ctg gat 144 
He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 

35 40 45 

gee gaa caa ggt tta gtt ata ccg ecg ttt gtg gag cca cat att cac 192 
Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 

50 55 60 

ctg gac ace acg caa ace gcc gga caa ccg aac tgg aat cag tec ggc 
Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

acg ctg ttt gaa ggc att gaa cgc tgg gcc gag cgc aaa gcg tta tta 
Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 
85 90 95 



48 



96 



240 



288 



acc cat gac gat gtg aaa caa cgc gca tgg caa acg ctg aaa tgg cag 336 
Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 

100 105 110 

att gcc aac ggc att cag cat gtg cgt acc cat gtc gat gtt teg gat 384 
He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 

115 120 125 

gca acg eta act gcg ctg aaa gca atg ctg gaa gtg aag cag gaa gtc 
Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 

130 135 140 

gcg ccg tgg att gat ctg caa ate gtc gcc ttc cet cag gaa ggg att 
Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

ttg teg tat ccc aac ggt gaa gcg ttg ctg gaa gag gcg tta cgc tta 528 
Deu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 1'75 



432 



480 
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ggg gca gat gta gtg ggg gcg att ccg cat ttt gaa ttt acc cgt gaa 576 
Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

tac ggc gtg gag teg ctg cat aaa acc ttc gcc ctg gcg caa aaa tac 624 
Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 

195 200 205 

gac cgt etc ate gac gtt cac tgt gat gag ate gat gac gag cag teg 672 
Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

egc ttt gtc gaa acc gtt get gee ctg gcg cac cat gaa ggc atg ggc 720 
Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

gcg cga gtc acc gcc age cac acc acg gea atg cac tec tat aac ggg 7 68 
Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

gcg tat acc tea cgc ctg ttc egc ttg ctg aaa atg tec ggt att aac 816 
Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

ttt gtc gee aac ccg ctg gtc aat att cat ctg caa gga cgt ttc gat 864 
Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 

acg tat cea aaa cgt cgc ggc ate acg cgc gtt aaa gag atg ctg gag 912 
Thr Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

tec ggc att aac gtc tgc ttt ggt cac gat gat gtc ttc gat ccg tgg 960 
Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

tat ccg ctg gga acg gcg aat atg ctg caa gtg ctg cat atg ggg ctg 1008 
Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

cat gtt tgc cag ttg atg ggc tac ggg cag att aac gat ggc ctg aat 1056 
His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

tta ate ace cac cac age gca agg acg ttg aat ttg cag gat tac ggc 1104 
Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

att gcc gcc gga aac age gcc aac ctg att ate ctg ccg get gaa aat 1152 
He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

ggg ttt gat gcg ctg cgc cgt cag gtt ccg gta cgt tat teg gta cgt 1200 
Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 

ggc ggc aag gtg att gcc age aca caa ccg gca caa acc acc gta tat 
Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

ctg gag cag eca gaa gcc ate gat tac aaa cgt tga 1284 
Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 



1248 



<210> 2 
<211> 427 
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<212> PRT 

<213> Escherichia coli 
<400> 2 

Val Ser Asn Asn Ala Leu Gin Thr lie He Asn Ala Arg Leu Pro Gly 
15 10 15 

Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 
20 25 30 

He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 
35 40 45 

Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 
50 55 60 

Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 
85 90 95 

Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 
100 105 110 

He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 

Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 
130 135 140 

Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 

165 170 175 

Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 
210 215 220 

Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 

260 265 270 

Phe Val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 

Thr Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 
290 295 300 

Ser Gly He Asn Val Cys Phe Gly His .Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 

325 330 335 

His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 
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Leu He Thr His His Ser Ala Arg Thr 
355 360 

He Ala Ala Gly Asn Ser Ala Asn Leu 

370 375 
Gly Phe Asp Ala Leu Arg Arg Gin Val 
385 390 
Gly Gly Lys Val He Ala Ser Tlir Gin 
405 

Leu Glu Gin Pro Glu Ala He Asp Tyr 
420 425 
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Leu Asn Leu Gin Asp Tyr Gly 

365 

He He Leu Pro Ala Glu Asn 
380 

Pro Val Arg Tyr Ser Val Arg 
395 400 
Pro Ala Gin Thr Thr Val Tyr 
410 415 

Lys Arg 



<210> 3 
<211> 1284 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der Icunstlichen Sequenz: coding for 
cytosine deaminase (codA) 

<220> 

<221> itiisc_f eature 
<222> (1)..(3) 

<223> mutation of GTG to ATG start codon for expression 
in eucaryotic hosts 

<220> 

<221> CDS 

<222> (1) - . (1281) 

<223> coding for cytosine deaminase (codA) 

<400> 3 

atg teg aat aac get tta caa aca att att aac gcc egg tta cca ggc 48 
Met Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 

15 10 15 

gaa gag ggg ctg tgg cag att cat ctg cag gac gga aaa ate age gee 96 
Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 

20 25 30 

att gat gcg caa tec ggc gtg atg cec ata act gaa aac age ctg gat 144 
He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 

35 40 45 

gee gaa caa ggt tta gtt ata ccg ceg ttt gtg gag cca cat att cae 192 
Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 

50 55 60 

ctg gac acc aeg caa ace gee gga caa ccg aac tgg aat cag tee ggc 240 
Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

aeg ctg ttt gaa ggc att gaa cgc tgg gcc gag cgc aaa gcg tta tta 288 
Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 

85 90 95 

ace cat gac gat gtg aaa caa cgc gea tgg caa aeg ctg aaa tgg cag 336 
Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 

100 105 110 

att gee aac ggc att cag cat gtg egt acc cat gtc gat gtt teg gat 384 
He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 
115 120 125 
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gca acg eta act gcg ctg aaa gca atg ctg gaa gtg aag cag gaa gtc 432 
Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 

130 135 140 

gcg cog tgg att gat ctg caa ate gtc gcc ttc cct cag gaa ggg att 480 
Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

ttg teg tat ccc aac ggt gaa gcg ttg ctg gaa gag gcg tta cgc tta 528 
Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

ggg gca gat gta gtg ggg gcg att ccg cat ttt gaa ttt acc cgt gaa 576 
Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thx Arg Glu 
180 185 190 

tac ggc gtg gag teg ctg cat aaa acc ttc gcc ctg gcg caa aaa tac 624 
Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 

195 200 205 

gac cgt etc ate gac gtt eac tgt gat gag ate gat gac gag cag teg 672 
Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 

210 215 220 

cgc ttt gtc gaa ace gtt get gee ctg gcg eac eat gaa ggc atg ggc 720 
Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

gcg ega gtc acc gcc age eac ace acg gca atg eac tec tat aac ggg 768 
Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

gcg tat acc tea cgc ctg ttc cgc ttg ctg aaa atg tec ggt att aac 816 
Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

ttt gtc gcc aac ccg ctg gtc aat att cat ctg caa gga cgt ttc gat 864 
Phe Val Ala Asn Pro Leu val Asn He His Leu Gin Gly Arg Phe Asp 

275 280 285 

acg tat cea aaa cgt cgc ggc ate acg cgc gtt aaa gag atg ctg gag 912 
Thr Tyr Pro Lys Arg Arg Gly He Thr 2Vrg Val Lys Glu Met Leu Glu 

290 295 300 

tee ggc att aac gtc tge ttt ggt eac gat gat gtc ttc gat ccg tgg 960 
Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Phe Asp Pro Trp 
305 310 315 320 

tat ccg ctg gga acg gcg aat atg ctg caa gtg ctg eat atg ggg ctg 1008 
Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 
325 330 335 

cat gtt tge cag ttg atg ggc tac ggg cag att aac gat ggc ctg aat 1056 
His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 

340 345 350 

tta ate acc eac eac age gca agg acg ttg aat ttg cag gat tac ggc 1104 
Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 

355 360 365 

att gcc gcc gga aac age gee aac ctg att ate ctg ccg get gaa aat 1152 
He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 

370 375 380 

ggg ttt gat gcg ctg cgc cgt cag gtt ccg gta cgt tat teg gta cgt 1200 
Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 
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ggc ggc aag gtg att gcc age aca caa ccg gca caa acc acc gta tat 1248 
Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

ctg gag cag cca gaa gcc ate gat tac aaa cgt tga 1284 
Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 

<210> 4 
<211> 427 
<212> PRT 

<213> Kunstliche Sequenz 

<223> Beschreibung der kiinstlichen Sequenz: coding for 
cytosine deaminase (codA) 

<400> 4 

Met Ser Asn Asn Ala Leu Gin Thr He He Asn Ala Arg Leu Pro Gly 
15 10 15 

Glu Glu Gly Leu Trp Gin He His Leu Gin Asp Gly Lys He Ser Ala 
20 25 30 

He Asp Ala Gin Ser Gly Val Met Pro He Thr Glu Asn Ser Leu Asp 

35 40 45 

Ala Glu Gin Gly Leu Val He Pro Pro Phe Val Glu Pro His He His 

50 55 60 

Leu Asp Thr Thr Gin Thr Ala Gly Gin Pro Asn Trp Asn Gin Ser Gly 
65 70 75 80 

Thr Leu Phe Glu Gly He Glu Arg Trp Ala Glu Arg Lys Ala Leu Leu 
85 90 95 

Thr His Asp Asp Val Lys Gin Arg Ala Trp Gin Thr Leu Lys Trp Gin 

100 105 110 

He Ala Asn Gly He Gin His Val Arg Thr His Val Asp Val Ser Asp 

115 120 125 

Ala Thr Leu Thr Ala Leu Lys Ala Met Leu Glu Val Lys Gin Glu Val 

130 135 140 

Ala Pro Trp He Asp Leu Gin He Val Ala Phe Pro Gin Glu Gly He 
145 150 155 160 

Leu Ser Tyr Pro Asn Gly Glu Ala Leu Leu Glu Glu Ala Leu Arg Leu 
165 170 175 

Gly Ala Asp Val Val Gly Ala He Pro His Phe Glu Phe Thr Arg Glu 
180 185 190 

Tyr Gly Val Glu Ser Leu His Lys Thr Phe Ala Leu Ala Gin Lys Tyr 
195 200 205 

Asp Arg Leu He Asp Val His Cys Asp Glu He Asp Asp Glu Gin Ser 

210 215 220 

Arg Phe Val Glu Thr Val Ala Ala Leu Ala His His Glu Gly Met Gly 
225 230 235 240 

Ala Arg Val Thr Ala Ser His Thr Thr Ala Met His Ser Tyr Asn Gly 
245 250 255 

Ala Tyr Thr Ser Arg Leu Phe Arg Leu Leu Lys Met Ser Gly He Asn 
260 265 270 

Phe val Ala Asn Pro Leu Val Asn He His Leu Gin Gly Arg Phe Asp 
275 280 285 
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lOir Tyr Pro Lys Arg Arg Gly He Thr Arg Val Lys Glu Met Leu Glu 

290 295 300 

Ser Gly He Asn Val Cys Phe Gly His Asp Asp Val Ptie Asp Pro Trp 
305 310 315 320 

Tyr Pro Leu Gly Thr Ala Asn Met Leu Gin Val Leu His Met Gly Leu 

325 330 335 

His Val Cys Gin Leu Met Gly Tyr Gly Gin He Asn Asp Gly Leu Asn 
340 345 350 

Leu He Thr His His Ser Ala Arg Thr Leu Asn Leu Gin Asp Tyr Gly 
355 360 365 

He Ala Ala Gly Asn Ser Ala Asn Leu He He Leu Pro Ala Glu Asn 
370 375 380 

Gly Phe Asp Ala Leu Arg Arg Gin Val Pro Val Arg Tyr Ser Val Arg 
385 390 395 400 

Gly Gly Lys Val He Ala Ser Thr Gin Pro Ala Gin Thr Thr Val Tyr 
405 410 415 

Leu Glu Gin Pro Glu Ala He Asp Tyr Lys Arg 
420 425 



<210> 5 
<211> 1221 
<212> DNA 

<213> Streptomyces griseolus 

<220> 
<221> CDS 
<222> (1) . . (1218) 

<223> coding for cytochrome P450-Sul (suaC) 
<400> 5 

atg acc gat acc gcc acg acg ccc cag acc acg gac gca ccc gcc ttc 
Met Thr Asp Thr Ala Thr Thr Pro Gin Thr Thr Asp Ala Pro Ala Phe 
15 10 15 

cog age aac egg ago tgt ccc tac cag tta ccg gac ggc tac gcc cag 
Pro Ser T^n Arg Ser Cys Pro Tyr Gin Leu Pro Asp Gly Tyr Ala Gin 
20 25 30 

etc egg gac ace ccc ggc ccc ctg eac egg gtg acg etc tac gac ggc 
Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly 
35 40 45 

cgt cag geg tgg gtg gtg acc aag eac gag gcc gcg cgc aaa ctg etc 192 
Arg Gin Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu 
50 55 60 



48 



96 



144 



240 



288 



ggc gac ccc egg ctg tec tec aac egg acg gac gac aac ttc ccc gee 
Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala 
65 70 75 80 

acg tea ccg cgc ttc gag gcc gtc egg gag age ccg cag gcg ttc ate 
Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gin Ala Phe He 

85 90 95 

ggc ctg gac ccg ccc gag eac ggc ace egg egg egg atg acg ate age 336 
Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr He Ser 
100 105 110 
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gag ttc acc 
Glu Phe Thr 

115 

gtg gtg cac 
Val Val His 
130 

gac ctg gtc 
Asp Leu Val 
145 

cga etc etc 
Arg Leu Leu 

age aag egg 
Ser Lys Arg 

egg aac gac 
Arg Asn Asp 
195 

acc gaa ccg 
Thr Glu Pro 
210 

gee aac ggc 
Ala Asn Gly 
225 

etc etc ate 
Leu Leu lie 

gtg ate acc 
Val lie Thr 



gac egc age 
Asp Arg Ser 
275 

gcc ate gee 
Ala He Ala 
290 

gtc gag ggg 
Val Glu Gly 
305 

teg ata gcc 
Ser He Ala 

gac ate cac 
Asp He His 

cac cag tgc 
His Gin Cys 
355 

etc aac gcc 
Leu Asn Ala 
370 



gtc aag egg ate 
Val Lys Arg He 

ggc ttc etc gac 
Gly Phe Leu Asp 
135 

agt cag ttc gcg 
Ser Gin Phe Ala 

150 

ggc gtg ccc tac 
Gly Val Pro Tyr 
165 

Ctg gtg cag tec 
Leu Val Gin Ser 
180 

etc gcg ggt tac 
Leu Ala Gly Tyr 

ggc gcg ggc ctg 
Gly Ala Gly Leu 
215 

gag ate gac cgt 
Glu He Asp Arg 
230 

gcc ggc cac gag 
Ala Gly His Glu 
245 

ctg ctg gac cac 
Leu Leu Asp His 
260 

etc gtg ccc ggc 
Leu Val Pro Gly 

gac ate gcg ggc 
Asp He Ala Gly 
295 

cac etc ate egg 
His Leu He Arg 
310 

aac egg gac ggc 
Asn Arg Asp Gly 
325 

egc tec gcg egc 
Arg Ser Ala Arg 
340 

ctg ggc cag aac 
Leu Gly Gin Asn 

etc atg gac egc 
Leu Met Asp Arg 
375 



aag ggc atg 
Lys Gly Met 
120 

gag atg ctg 
Glu Met Leu 

ctg ccg gtg 
Leu Pro Val 



gcc gac cac 
Ala Asp His 
170 

aeg gac gcg 
Thr Asp Ala 
185 

ctg gac ggc 
Leu Asp Gly 
200 

gtg ggc get 
Val Gly Ala 

gag gaa ctg 
Glu Glu Leu 

ace acg gcc 
Thr Thr Ala 
250 

ccc gag cag 
Pro Glu Gin 
265 

gcg gtg gag 
Ala Val Glu 
280 

ggc egc gtc 
Gly Arg Val 



gcc ggc gag 
Ala Gly Glu 

acg gtg tac 
Thr Val Tyr 
330 

cac cac etc 
His His Leu 
345 

etc gee egg 
Leu Ala Arg 
360 

gtc ccg acg 
Val Pro Thr 



egc ccc gag gtc 
Arg Pro Glu Val 
125 

gee gcc ggc ccg 
Ala Ala Gly Pro 
140 

ccc tec atg gtg 
Pro Ser Met Val 

155 

gag ttc ttc cag 
Glu Phe Phe Gin 

cag age gcg etc 
Gin Ser Ala Leu 
190 

etc ate acc cag 
Leu He Thr Gin 
205 

ctg gtc gee gac 
Leu Val Ala Asp 
220 

ate tec acc gcg 
He Ser Thr Ala 
235 

teg atg ace tee 
Ser Met Thr Ser 

tac gee gcc ctg 
Tyr Ala Ala Leu 
270 

gaa ctg etc egc 
Glu Leu Leu Arg 
285 

gcc acg gcg gac 
Ala Thr Ala Asp 
300 

ggc gtg ate gtc 
Gly Val He Val 
315 

gag gac ccg gac 
Glu Asp Pro Asp 

gcc ttc ggc ttc 
Ala Phe Gly Phe 
350 

ctg gag ctg gag 
Leu Glu Leu Glu 
365 

ctg cga ctg gee 
Leu Arg Leu Ala 
380 



gag gag 384 
Glu Glu 

ace gcc 432 
Thr Ala 

ate tgc 480 
He Cys 
160 

gac gcg 528 

Asp Ala 

175 

ace gcg 576 
Thr Ala 

ttc cag 624 
Phe Gin 

cag ctg 672 
Gin Leu 

atg ctg 720 
Met Leu 
240 

etc age 768 

Leu Ser 

255 

egc gee 816 
Arg Ala 

tac etc 864 
Tyr Leu 

ate gag 912 
He Glu 

gtc aac 960 
Val Asn 
320 

gee etc 1008 

Ala Leu 

335 

ggc gtg 1056 
Gly Val 



gtc ate 1104 
Val He 



gtc ccc 1152 
Val Pro 
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gtc gag cag ttg gtg ctg egg ccg ggt acg acg ate cag ggc gtc aac 
Val Glu Gin Leu Val Leu 2U:g Pro Gly Thr Thr He Gin Gly Val Asn 
385 390 395 400 

gaa etc ccg gtc acc tgg tga 
Glu Leu Pro Val Tlir Trp 
405 

<210> 6 

<211> 406 
<212> PRT 

<213> Streptoitryces griseolus 
<400> 6 

Met Thr Asp Thr Ala Thr T3xr Pro Gin Thr Thr Asp Ala Pro Ala Phe 
15 10 15 

Pro Ser Asn Arg Ser Cys Pro Tyr Gin Leu Pro Asp Gly Tyr Ala Gin 
20 25 30 

Leu Arg Asp Tlir Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly 

35 40 45 

Arg Gin Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu 

50 55 60 

Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala 
65 70 75 80 

Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gin Ala Phe He 

85 90 95 

Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr He Ser 

100 105 110 

Glu Phe Thr Val Lys Arg He Lys Gly Met Arg Pro Glu Val Glu Glu 

115 120 125 

Val val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala 

130 135 140 

Asp Leu val Ser Gin Phe Ala Leu Pro Val Pro Ser Met Val He Cys 
145 150 155 160 

Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gin Asp Ala 
165 170 175 

Ser Lys Arg Leu Val Gin Ser Thr Asp Ala Gin Ser Ala Leu Thr Ala 

ISO 185 190 

Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu He Thr Gin Phe Gin 

195 200 205 

Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gin Leu 

210 215 220 

Ala Asn Gly Glu He Asp Arg Glu Glu Leu He Ser Thr Ala Met Leu 
225 230 235 240 

Leu Leu He Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser 

245 250 255 

Val He Thr Leu Leu Asp His Pro Glu Gin Tyr Ala Ala Leu Arg Ala 

260 265 270 

Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu 

275 280 285 

Ala He Ala Asp He Ala Gly Gly Arg Val Ala Thr Ala Asp He Glu 
290 295 300 



1221 
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Val Glu Gly His Leu lie Arg Ala Gly Glu Gly Val He Val Val Asn 
305 310 315 320 

Ser He Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu 
325 330 335 

Asp He His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val 

340 345 350 

His Gin Cys Leu Gly Gin Asn Leu Ala Arg Leu Glu Leu Glu Val He 

355 360 365 

Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro 

370 375 380 

Val Glu Gin Leu Val Leu Arg Pro Gly Thr Thr He Gin Gly Val Asn 

385 390 395 400 

Glu Leu Pro Val Thr Trp 
405 



48 



<210> 7 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 
<221> CDS 
<222> (1) . . (1401) 

<223> coding for indole acetamide hydrolase (titis2) 
<400> 7 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 
Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata geg cgt tge 96 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gea aaa cea tta aat gee ett etg get aca gae tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 

35 40 45 

ttg egg cga age gee aaa aaa att gat egt cat gga aac gee gga tta 192 
Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 

50 55 60 

ggt ett tge ggc att eca etc tgt ttt aag geg aac ate geg acc ggc 240 
Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

ata ttt cct aca age get get act ccg geg etg ata aac cac ttg eca 288 
He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 
85 90 95 

aag ata cea tec cgc gte gca gaa aga ett ttt tea get gga gea etg 336 
Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 

100 105 110 

ccg ggt gee teg gga aac atg cat gag tta teg ttt gga att acg age 384 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

aac aac tat gee ace ggt geg gtg egg aac ccg tgg aat cea agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 



624 



672 



720 



768 
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ata cca gga ggc tea age ggt ggt gtg get get gcg gtg gca age cga 480 
lie Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

ttg atg tta ggc ggc ata gge ace gat aec ggt gea tct gtt cge eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 

165 170 175 

cee gea gcc ctg tgt gge gta gta gga ttt cga ecg acg ctt get cga 576 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 

ISO 185 190 

tat cea aga gat egg ata ata ccg gtc age cee ace egg gae aec gcc 
Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 

195 200 205 

gga ate ata gcg cag tge gta gcc gat gtt ata ate etc gae cag gtg 
Glv He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 

210 215 220 

att tec gga egg teg gcg aaa att tea cee atg ccg ctg aag ggg ctt 
He ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 

egg ate ggc etc cec act aec tac ttt tac gat gae ctt gat get gat 
Ara He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 

245 250 255 

gtg gcc tte gea get gaa acg acg att cge ttg eta gcc aac aga ggc 816 
val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 

260 265 270 

gta aec ttt gtt gaa gcc gae ate cee cae eta gag gaa ctg aat agt 
val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 

275 280 285 

ggg gea agt ttg cca att gcg ctt tac gaa ttt eea cae get eta aaa 
III Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 

290 295 300 

aag tat etc gae gat ttt gtg gga aca gtt tct ttt tct gae gtt ate 
Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

aaa gga att cgt age ccc gat gta gcg aac att gtc agt gcg caa att 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He val Ser Ala Gin He 

325 330 335 

gat ggg cat caa att tec aac gat gaa tat gaa ctg gcg cgt caa tee 
Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 

340 345 350 

tte agg cca agg etc cag gcc act tat egg aat tac tte aga etc tat 
Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 

355 360 365 

cag tta gat gca ate ctt tte cca act gca ccc tta gcg gcc aaa gcc 
Gin Leu ASP Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 

370 375 380 

ata ggt cag gag teg tea gtc ate cae aat ggc tea atg atg aac act 
He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 390 395 

tte aag ate tac gtg cga aat gtg gae cea age age aac gca ggc eta 
Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 
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cct ggg ttg age ctt cct gcc tgc ctt aca cct gat cgc ttg cct gtt 1296 
Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

gga atg gaa att gat gga tta gcg ggg tea gae cac cgt ctg tta gca 1344 
Gly Met Glu lie Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 

435 440 445 

ate ggg gca gea tta gaa aaa gcc ata aat ttt cct tec ttt ccc gat 1392 
lie Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

get ttt aat tag 1404 

Ala Phe Asn 

465 

<210> 8 
<211> 467 
<212> PRT 

<213> Agrobacterium tuiaefaciens 
<400> 8 

Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 
85 90 95 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 125 

Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 

145 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 
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val Ala Phe Ala Ala Glu Thr lOir He Arg Leu Leu Ala Asn Arg Gly 

260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 

275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 

290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 

340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 

355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 

370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 

<210> 9 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1) . . (1401) 

<22 3> coding for indole acetamide hydrolase (tms2) 
<400> 9 

g aga egg 48 
u Arg Arg 
15 



atg 
Met 
1 


gtg 
Val 


ccc 
Pro 


att 
He 


ace 
Thr 
5 


teg 
Ser 


tta 
Leu 


gca 
Ala 


caa 
Gin 


acc 
Thr 
10 


eta 
Leu 


gaa 
Glu 


ege 
Arg 


aaa 
Lys 


gac 
Asp 


tac 
Tyr 


tec 
Ser 
20 


tgc 
Cys 


tta 
Leu 


gaa 
Glu 


eta 
Leu 


gta 
Val 
25 


gaa 
Glu 


act 
Thr 


ctg 
Leu 


ata 
He 


caa get 
Gin Ala 


gca 
Ala 
35 


aaa 
Lys 


eca 
Pro 


tta 
Leu 


aat 
Asn 


gee 
Ala 
40 


ett 
Leu 


ctg 
Leu 


get 
Ala 


aca 
Thr 


gac 
Asp 
45 


ttg 
Leu 


egg 
Arg 
50 


cga 
Arg 


age 
Ser 


gee 
Ala 


aaa 
Lys 


aaa 
Lys 
55 


att 
He 


gat 
Asp 


cgt 
Arg 


eat 
His 


gga 
Gly 
60 


aac 
Asn 



30 



96 



144 



192 
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ggt ctt tgc ggc att cca etc tgt ttt aag gcg aac ate gcg acc ggc 240 
Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

ata ttt cct aca age get get act ccg gcg ctg ata aac cac ttg cca 288 
He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 
85 90 95 

aag ata cca tec cgc gtc gca gaa aga ctt ttt tea get gga gca ctg 336 
Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

ccg ggt gcc teg gga aac atg cat gag tta teg ttt gga att acg age 384 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 125 

aac aac tat gcc acc ggt gcg gtg egg aac ccg tgg aat cca agt ctg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 

ata cca gga ggc tea age ggt ggt gtg get get gcg gtg gca age ega 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

ttg atg tta ggc ggc ata ggc acc gat acc ggt gca tet gtt cgc eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccc gca gcc ctg tgt ggc gta gta gga ttt ega ccg acg ctt get ega 576 
Pro Ala Ala Leu Gys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
ISO 185 190 

tat cca aga gat egg ata ata ccg gtc age ccc acc egg gac acc gcc 624 
Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

gga ate ata gcg eag tgc gta gee gat gtt ata ate etc gat cag gtg 672 
Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

att tec gga egg teg gcg aaa att tea ccc atg ccg ctg aag ggg ctt 720 
He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

egg ate ggc etc eee act ace tac ttt tac gat gac ctt gat get gat 768 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

gtg gcc ttc gca get gaa acg acg att cgc ttg eta gee aac aga ggc 816 
Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

gta acc ttt gtt gaa gcc gac ate ccc cac eta gag gaa ctg aat agt 864 
val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

ggg gca agt ttg cca att gcg ctt tac gaa ttt cca cac get eta aaa 912 
Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

aag tat etc gac gat ttt gtg gga aca gtt tet ttt tct gac gtt ate 960 
Lys Tyr Leu Asp Asp Phe Val Gly l^ir Val Ser Phe Ser Asp Val He 
305 310 315 320 

aaa gga att cgt age ccc gat gta gcg aac att gtc agt gcg caa att 1008 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 
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gat ggg cat caa att tec aac gat gaa tat gaa ctg gcg cgt caa tec 1056 
Asp Gly His Gin lie Ser Asn Asp Glu Tyr Glu Deu Ala Arg Gin Ser 

340 345 350 

ttc agg cca agg etc cag gee act tat egg aat tac ttc aga etc tat 1104 
Phe Arg Pro Arg Leu Gin Ala Tlir Tyr Arg Asn Tyr Phe Arg Leu Tyr 

355 360 365 

cag tta gat gca ate ett ttc cca act gca ccc tta gcg gee aaa gee 1152 
Gin Leu Asp Ala lie Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 

370 375 380 

ata ggt cag gag teg tea gtc ate cac aat ggc tea atg ata aac act 
He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met He Asn Thr 
385 390 395 400 

ttc aag ate tac gtg cga aat gtg gae cca age age aac gca ggc eta 
Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

cct ggg ttg age ett cet gee tge ett aea cct gat cgc ttg cet gtt 
Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

gga atg gaa att gae gga tta gcg ggg tea gae cac cgt ctg tta gca 
Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

ate ggg gca gca tta gaa aaa gee ata aat ttt cct tec ttt ccc gat 
He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

get ttt aat tag 
Ala Phe Asn 
465 

<210> 10 
<211> 467 
<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 10 

Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 

15 10 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

Leu Arg Arg Ser Ala Lys Lys He Asp Arg His Gly Asn Ala Gly Leu 

50 55 60 

Glv Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

He Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 

100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 125 

Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 
130 135 140 



1200 



1248 



1296 



1344 



1392 



1404 
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He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 

145 150 155 160 

Leu Met Leu Gly Gly He Gly llir Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Ala Arg 
180 185 190 

Tyr Pro Arg Asp Arg He He Pro Val Ser Pro Tlir Arg Asp Thr Ala 
195 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 
210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 
275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 
325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 
370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met He Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Pro Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 11 
<211> 609 
<212> DNA 

<213> Xanthobacter autotrophicus 
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<220> 
<221> CDS 
<222> (1)..(603) 

<223> coding for haloalkane dehalohenase 

<400> 11 

atg tea acg ttt ttt gaa ccg gag aac gga atg aaa caa aac gcc aaa 
Met Ser Thx Ph.e Phe Glu Pro Glu Asn Gly Met Lys Gin Asn Ala Lys 
15 10 15 

acc gaa cga ate ctg gat gtc gcg etc gaa ttg ctt gag aca gag ggt 
Thr Glu Arg He Leu Asp Val Ala Leu Glu Leu Leu Glu Thr Glu Gly 
20 25 30 

gag ttt ggt ttg acg atg agg cag gtg gca acg caa gcg gac atg tec 
Glu Plie Gly Leu Tlir Met Arg Gin Val Ala Thr Gin Ala Asp Met Ser 
35 40 45 

ctg age aac gtt cag tac tat ttc aag tec gag gac ctg etc etc gtg 192 
Leu ser Asn Val Gin Tyr Tyr Phe Lys Ser Glu Asp Leu Leu Leu Val 
50 55 60 



gee atg gca gac cgt tac ttt caa egg tgc ctg aca acc atg get gag 
Ala Met Ala Asp Arg Tyr Plie Gin Arg Cys Leu Thr Thr Met Ala Glu 
65 70 75 80 

cat ccg ccc tta teg gca ggg cgt gat caa cac gcc cag tta aga gcg 
His Pro Pro Leu Ser Ala Gly Arg Asp Gin His Ala Gin Leu Arg Ala 
85 90 95 

ttg tta cga gaa ctg etc ggt cat ggt ctt gag att tee gag atg tgt 
Leu Leu Arg Glu Leu Leu Gly His Gly Leu Glu He Ser Glu Met Cys 



100 105 110 

cga ata ttc agg gag tac tgg gca ate gcc acc cgt aat gaa act gtt 

Arg He Phe Arg Glu Tyr Trp Ala He Ala Thr Arg Asn Glu Thr Val 
115 120 125 



gtg ttg gag cag ctt cgc ate age aat tcatga 
Val Leu Glu Gin Leu Arg He Ser Asn 
195 200 

<210> 12 
<211> 201 
<212> PRT 

<213> Xanthobacter autotroph! cus 
<400> 12 

Met Ser Thr Phe Phe Glu Pro Glu Asn Gly Met Lys Gin Asn Ala Lys 
15 10 15 



48 



96 



144 



240 



288 



336 



384 



cac ggc tat etc aag teg tac tat egg gat etc gee gaa gtg atg get 432 
His Gly Tyr Leu Lys Ser Tyr Tyr Arg Asp Leu Ala Glu Val Met Ala 
130 135 140 

gag aag ctt gcg cea ctg gcc age age gaa aag gcg ctg gee gtg gee 480 
Glu Lys Leu Ala Pro Leu Ala Ser Ser Glu Lys Ala Leu Ala Val Ala 
145 150 155 160 

gta tct ttg gtt att cct tat gtt gag ggg tat teg gta acg gee att 528 
Val Ser Leu Val He Pro Tyr Val Glu Gly Tyr Ser Val Thr Ala He 
165 170 175 

gca atg ccc gaa tec att gat acg att tec gag acg ctg ace aat gtg 576 
Ala Met Pro Glu Ser He Asp Thr He Ser Glu Thr Leu Thr Asn Val 
180 185 190 



609 
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Thr Glu firg He Leu Asp Val Ala Leu Glu Leu Leu Glu Thr Glu Gly 
20 25 30 

Glu Phe Gly Leu Thr Met Arg Gin Val Ala Thx Gin Ala Asp Met Ser 
35 40 45 

Leu Ser Asn Val Gin Tyr Tyr Phe Lys Ser Glu Asp Leu Leu Leu Val 

50 55 60 

Ala Met Ala Asp Arg Tyr Phe Gin Arg Cys Leu Thr Thr Met Ala Glu 
65 70 75 80 

His Pro Pro Leu Ser Ala Gly Arg Asp Gin His Ala Gin Leu Arg Ala 
85 90 95 

Leu Leu Arg Glu Leu Leu Gly His Gly Leu Glu He Ser Glu Met Cys 
100 105 110 

Arg He Phe Arg Glu Tyr Trp Ala He Ala Thr Arg Asn Glu Thr Val 
115 120 125 

His Gly Tyr Leu Lys Ser Tyr Tyr Arg Asp Leu Ala Glu Val Met Ala 

130 135 140 

Glu Lys Leu Ala Pro Leu Ala Ser Ser Glu Lys Ala Leu Ala Val Ala 
145 150 155 160 

Val Ser Leu Val He Pro Tyr Val Glu Gly Tyr Ser Val Thr Ala He 
165 170 175 

Ala Met Pro Glu Ser He Asp Thr He Ser Glu Thr Leu Thr Asn Val 
180 185 190 

Val Leu Glu Gin Leu Arg He Ser Asn 
195 200 



<210> 13 
<211> 1131 
<212> DNA 

<213> Herpes simplex virus 1 

<220> 
<221> CDS 
<222> (1) . . (1128) 

<223> coding for thymidine kinase (TK) 
<400> 13 

atg get teg tac ccc tgc cat caa cac gcg tct gcg ttc gac cag get 
Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

gcg cgt tct cgc ggc cat age aac ega cgt aeg gcg ttg cgc ect cgc 
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 

egg cag caa gaa gcc acg gaa gtc cgc ctg gag cag aaa atg ccc aeg 144 
Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

eta ctg egg gtt tat ata gac ggt ect cac ggg atg ggg aaa acc acc 
Leu Leu Arg Val Tyr He Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

acc acg caa ctg ctg gtg gee ctg ggt teg cgc gac gat ate gtc tac 
Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp He Val Tyr 
65 70 75 80 



48 



96 



192 



240 
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gta ccc gag ccg atg act tac tgg cag gtg ctg ggg get tec gag aca 288 
Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 
85 90 95 

ate gcg aac ate tac acc aca caa cac cgc etc gac cag ggt gag ata 336 
lie Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

teg gee ggg gac gcg gcg gtg gta atg aca age gcc cag ata aca atg 384 
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 

115 120 125 

ggc atg cct tat gcc gtg acc gac gcc gtt ctg get cct cat gtc ggg 432 
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 

130 135 140 

ggg gag get ggg agt tea cat gcc ccg ccc ccg gcc etc acc etc ate 
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

ttc gac cgc cat ccc ate gcc gcc etc ctg tgc tac ccg gcc gcg cga 
Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

tac ctt atg ggc age atg acc ccc cag gcc gtg ctg gcg ttc gtg gee 576 
Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

etc ate ccg ccg acc ttg ccc ggc aca aac ate gtg ttg ggg gcc ctt 
Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 



480 



528 



624 



672 



720 



768 



ccg gag gac aga cac ate gac cgc ctg gcc aaa cgc cag cgc ccc ggc 
Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 

210 215 220 

gag egg ctt gac ctg get atg ctg gcc gcg att cgc cgc gtt tac ggg 
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 230 235 240 

ctg ctt gee aat acg gtg egg tat ctg cag ggc ggc ggg teg tgg tgg 
Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

gag gat tgg gga cag ctt teg ggg acg gcc gtg ccg ccc cag ggt gcc 816 
Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

gag ccc cag age aac gcg ggc cca cga ccc cat ate ggg gac acg tta 
Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

ttt acc ctg ttt egg gee ccc gag ttg ctg gee ccc aac ggc gac ctg 
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 

290 295 300 

tat aac gtg ttt gcc tgg gee ttg gac gtc ttg gcc aaa cgc etc cgt 
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

ccc atg cac gtc ttt ate ctg gat tac gac caa teg ccc gcc ggc tgc 
Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

egg gac gcc ctg ctg caa ctt acc tec ggg atg gtc cag acc cac gtc 
Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 



864 



912 



960 



1008 



1056 
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acc acc cca ggc tec ata ccg acg ate tge gac ctg gcg cgc acg ttt 1104 
'Hit Thr Pro Gly Ser lie Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

gee egg gag atg ggg gag get aae tga 1131 
Ala Arg Glu Met Gly Glu Ala Asn 
370 375 

<210> 14 
<211> 376 
<212> PRT 

<213> Herpes siitqplex virus 1 
<400> 14 

Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 

20 25 30 

Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 
35 40 45 

Leu Leu Arg Val Tyr He Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp He Val Tyr 
65 70 75 80 

Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 
85 90 95 

He Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 
115 120 125 

Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 
130 135 140 

Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 

Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 

165 170 175 

Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

Leu He Pro Pro Thr Leu Pro Gly Thr Asn He Val Leu Gly Ala Leu 
195 200 205 

Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 

225 230 235 240 

Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 
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Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 

305 310 315 320 

Pro Met His Val Phe lie Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 

340 345 350 

Thr Thr Pro Gly Ser lie Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

Ala Arg Glu Met Gly Glu Ala Asn 
370 375 



48 



96 



<210> 15 
<211> 1131 
<212> DNA 

<213> Herpes simplex virus 1 

<220> 
<221> CDS 
<222> (1) . - (1128) 

<223> coding for thymidine kinase (TK) 
<400> 15 

atg get teg tac ccc tgc cat caa cac gcg tct gcg ttc gac cag get 
Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

gcg cgt tct cgc ggc cat age aac ega cgt aeg gcg ttg ego cct cgc 
Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 

egg cag caa gaa gee acg gaa gtc cgc ctg gag cag aaa atg ccc acg 144 

Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 

35 40 45 

eta ctg egg gtt tat ata gac ggt cct cac ggg atg ggg aaa acc ace 192 

Leu Leu Arg Val Tyr lie Asp Gly Pro His Gly Met Gly Lys Thr Thr 

50 55 60 

acc acg caa ctg ctg gtg gee ctg ggt teg cgc gac gat ate gtc tac 240 

Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp lie Val Tyr 

65 70 75 80 

gta ccc gag ccg atg act tac tgg cag gtg ctg ggg get tec gag aca 288 
val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 

85 90 95 

ate gcg aac ate tac acc aca caa cac cgc etc gac cag ggt gag ata 336 
He Ala Asn He Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu He 
100 105 110 

teg gee ggg gac gcg gcg gtg gta atg aca age gee cag ata aca atg 384 
Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin He Thr Met 
115 120 125 

ggc atg cct tat gee gtg acc gac gee gtt ctg get cct cat gtc ggg 
Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 

130 135 140 

ggg gag get ggg agt tea cat gee ccg ccc ccg gee etc acc etc ate 
Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu He 
145 150 155 160 



432 



480 
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ttc gac cgc cat ccc ate gcc gcc etc ctg tgc tac ccg gcc gcg cga 528 

Phe Asp Arg His Pro He Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 
165 170 175 

tac ctt atg gge age atg ace ccc cag gcc gtg ctg gcg ttc gtg gcc 576 
Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

etc ate ccg ccg ace ttg ccc ggc aca aac ate gtg ttg ggg gcc ctt 624 
Leu He Pro Pro Thr Leu Pro Gly Ttir Asn He Val Leu Gly Ala Leu 
195 200 205 

ccg gag gac aga cac ate gac cgc ctg gcc aaa cgc cag cgc ccc ggc 672 
Pro Glu Asp Arg His He Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 
210 215 220 

gag egg ctt gac ctg get atg ctg gee gcg att cgc cgc gtt tac ggg 720 
Glu Arg Leu Asp Leu Ala Met Leu Ala Ala He Arg Arg Val Tyr Gly 
225 230 235 240 

ctg ctt gcc aat aeg gtg egg tat ctg cag gge ggc ggg teg tgg tgg 7 68 
Leu Leii Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 

245 250 255 

gag gat tgg gga cag ctt teg ggg aeg gee gtg ccg ccc cag ggt gee 816 
Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

gag ccc cag age aac gcg gge eca cga ccc cat ate ggg gac aeg tta 864 
Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His He Gly Asp Thr Leu 
275 280 285 

ttt ace ctg ttt egg gcc ccc gag ttg ctg gee ccc aac gge gac ctg 912 
Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 
290 295 300 

tat aac gtg ttt gcc tgg gee ttg gac gte ttg gcc aaa cgc etc cgt 960 
Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

ccc atg cac gtc ttt ate ctg gat tac gac caa teg ccc gcc ggc tgc 1008 
Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

egg gac gcc ctg ctg caa ctt acc tec ggg atg gtc cag ace cac gtc 1056 
Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 

acc acc eca ggc tec ata ccg aeg ate tgc gac ctg gcg cgc aeg ttt 1104 
Thr Thr Pro Gly Ser He Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

gcc egg gag atg ggg gag get aac tga 1131 
Ala Arg Glu Met Gly Glu Ala Asn 
370 375 

<210> 16 
<211> 376 
<212> PRT 

<213> Herpes simplex virus 1 
<400> 16 

Met Ala Ser Tyr Pro Cys His Gin His Ala Ser Ala Phe Asp Gin Ala 
15 10 15 

Ala Arg Ser Arg Gly His Ser Asn Arg Arg Thr Ala Leu Arg Pro Arg 
20 25 30 
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Arg Gin Gin Glu Ala Thr Glu Val Arg Leu Glu Gin Lys Met Pro Thr 

35 40 45 

Leu Leu Arg Val Tyr lie Asp Gly Pro His Gly Met Gly Lys Thr Thr 
50 55 60 

Thr Thr Gin Leu Leu Val Ala Leu Gly Ser Arg Asp Asp lie Val Tyr 

65 70 75 80 

Val Pro Glu Pro Met Thr Tyr Trp Gin Val Leu Gly Ala Ser Glu Thr 
85 90 95 

lie Ala Asn lie Tyr Thr Thr Gin His Arg Leu Asp Gin Gly Glu lie 
100 105 110 

Ser Ala Gly Asp Ala Ala Val Val Met Thr Ser Ala Gin lie Thr Met 
115 120 125 

Gly Met Pro Tyr Ala Val Thr Asp Ala Val Leu Ala Pro His Val Gly 

130 135 140 

Gly Glu Ala Gly Ser Ser His Ala Pro Pro Pro Ala Leu Thr Leu lie 
145 150 155 160 

Phe Asp Arg His Pro lie Ala Ala Leu Leu Cys Tyr Pro Ala Ala Arg 

165 170 175 

Tyr Leu Met Gly Ser Met Thr Pro Gin Ala Val Leu Ala Phe Val Ala 
180 185 190 

Leu lie Pro Pro Thr Leu Pro Gly Thr Asn lie Val Leu Gly Ala Leu 

195 200 205 

Pro Glu Asp Arg His lie Asp Arg Leu Ala Lys Arg Gin Arg Pro Gly 

210 215 220 

Glu Arg Leu Asp Leu Ala Met Leu Ala Ala lie Arg Arg Val Tyr Gly 
225 230 235 240 

Leu Leu Ala Asn Thr Val Arg Tyr Leu Gin Gly Gly Gly Ser Trp Trp 
245 250 255 

Glu Asp Trp Gly Gin Leu Ser Gly Thr Ala Val Pro Pro Gin Gly Ala 
260 265 270 

Glu Pro Gin Ser Asn Ala Gly Pro Arg Pro His lie Gly Asp Thr Leu 
275 280 285 

Phe Thr Leu Phe Arg Ala Pro Glu Leu Leu Ala Pro Asn Gly Asp Leu 

290 295 300 

Tyr Asn Val Phe Ala Trp Ala Leu Asp Val Leu Ala Lys Arg Leu Arg 
305 310 315 320 

Pro Met His Val Phe He Leu Asp Tyr Asp Gin Ser Pro Ala Gly Cys 
325 330 335 

Arg Asp Ala Leu Leu Gin Leu Thr Ser Gly Met Val Gin Thr His Val 
340 345 350 

Thr Thr Pro Gly Ser He Pro Thr He Cys Asp Leu Ala Arg Thr Phe 
355 360 365 

Ala Arg Glu Met Gly Glu Ala Asn 
370 375 



<210> 17 
<211> 840 
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<212> DMA 

<213> Toxoplasma gondii 

<220> 

<221> CDS 

<222> (1)..{837) 

<223> coding for hypoxanthine-xanthine-guanine 
phosphor ibosyl transferase (HXGPRTase) 

<400> 17 

atg gcg tec aaa ccc att gaa gaa tec egg teg caa aaa egg agt gee 48 
Met Ala Ser Lys Pro lie Glu Glu Ser Arg Ser Gin Lys Arg Ser Ala 

15 10 15 

ttc tea gae ate ttc tgt tgt tge act cct aat gaa ggg get ate gtg 96 
Phe Ser Asp lie Phe Cys Cys Cys Thr Pro Asn Glu Gly Ala He Val 
20 25 30 

ccc agt gae cca atg gtc tec ace agt get cca gca cgc ace agt get 144 
Pro Ser Asp Pro Met Val Ser Thr Ser Ala Pro Ala Arg Thr Ser Ala 

35 40 45 

cca gcg cgc tec agt gca ctt caa gae tac ggc aag ggc aag ggc cgt 192 
Pro Ala Arg Ser Ser Ala Leu Gin Asp Tyr Gly Lys Gly Lys Gly Arg 

50 55 60 

att gag ccc atg tat ate ccc gae aac ace ttc tac aac get gat gae 240 
He Glu Pro Met Tyr He Pro Asp Asn Thr Phe Tyr Asn Ala Asp Asp 
65 70 75 80 

ttt ctt gtg ccc ccc cac tge aag ccc tac att gae aaa ate etc etc 2 88 
Phe Leu Val Pro Pro His Cys Lys Pro Tyr He Asp Lys He Leu Leu 
85 90 95. 

cct ggt gga ttg gtc aag gae aga gtt gag aag ttg gcg tat gae ate 33 6 
Pro Gly Gly Leu Val Lys Asp Arg Val Glu Lys Leu Ala Tyr Asp He 
100 105 110 

cac aga act tac ttc ggc gag gag ttg cac ate att tge ate etg aaa 384 
His Arg Thr Tyr Phe Gly Glu Glu Leu His He He Cys He Leu Lys 

115 120 125 

ggc tct cgc ggc ttc ttc aac ctt etg ate gae tac ctt gee acc ata 432 
Gly Ser Arg Gly Phe Phe Asn Leu Leu He Asp Tyr Leu Ala Thr He 

130 135 140 

cag aag tac agt ggt cgt gag tec age gtg ccc ccc ttc ttc gag cac 480 
Gin Lys Tyr Ser Gly Arg Glu Ser Ser Val Pro Pro Phe Phe Glu His 
145 150 155 160 

tat gtc cgc etg aag tee tac cag aac gae aac age aca ggc cag etc 528 
Tyr Val Arg Leu Lys Ser Tyr Gin Asn Asp Asn Ser Thr Gly Gin Leu 
165 170 175 

acc gtc ttg age gae gae ttg tea ate ttt cgc gae aag cac gtt etg 576 
Thr Val Leu Ser Asp Asp Leu Ser He Phe Arg Asp Lys His Val Leu 

180 185 190 

att gtt gag gae ate crte gae acc ggt ttc ace etc ace gag ttc ggt 624 
He Val Glu Asp He Val Asp Thr Gly Phe Thr Leu Thr Glu Phe Gly 

195 200 205 

gag cgc etg aaa gee gtc ggt ccc aag teg atg aga ate gee ace etc 672 
Glu Arg Leu Lys Ala Val Gly Pro Lys Ser Met Arg He Ala Thr Leu 

210 215 220 

gtc gag aag cgc aca gat cgc tec aac age ttg aag ggc gae ttc gtc 720 
Val Glu Lys Arg Thr Asp Arg Ser Asn Ser Leu Lys Gly Asp Phe Val 
225 230 235 240 
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ggc ttc age att gaa gac gtc tgg ate gtt ggt tgc tge tac gac ttc 768 
Gly Phe Ser He Glu Asp Val Tip He Val Gly Cys Cys Tyr Asp Phe 
245 250 255 

aac gag atg ttc cgc gac ttc gac cac gtc gee gtc ctg age gac gcc 816 
Asn Glu Met Phe Arg Asp Phe Asp His Val Ala Val Leu Ser Asp Ala 
260 265 270 

get cgc aaa aag ttc gag aag taa 
Ala Arg Lys Lys Phe Glu Lys 
275 

<210> 18 
<211> 279 
<212> PRT 

<213> Toxoplasma gondii 
<400> 18 

Met Ala Ser Lys Pro He Glu Glu Ser Arg Ser Gin Lys Arg Ser Ala 
15 10 15 

Phe Ser Asp He Phe Cys Cys Cys Thr Pro Asn Glu Gly Ala He Val 
20 25 30 

Pro Ser Asp Pro Met Val Ser Thr Ser Ala Pro Ala Arg Thr Ser Ala 
35 40 45 

Pro Ala Arg Ser Ser Ala Leu Gin Asp Tyr Gly Lys Gly Lys Gly Arg 

50 55 60 

He Glu Pro Met Tyr He Pro Asp Asn Thr Phe Tyr Asn Ala Asp Asp 
65 70 75 80 

Phe Leu Val Pro Pro His Cys Lys Pro Tyr He Asp Lys He Leu Leu 
85 90 95 

Pro Gly Gly Leu Val Lys Asp Arg Val Glu Lys Leu Ala Tyr Asp He 
100 105 110 

His Arg Thr Tyr Phe Gly Glu Glu Leu His He He Cys He Leu Lys 
115 120 125 

Gly Ser Arg Gly Phe Phe Asn Leu Leu He Asp Tyr Leu Ala Thr He 

130 135 140 

Gin Lys Tyr Ser Gly Arg Glu Ser Ser Val Pro Pro Phe Phe Glu His 
145 150 155 160 

Tyr Val Arg Leu Lys Ser Tyr Gin Asn Asp Asn Ser Thr Gly Gin Leu 
165 170 175 

Thr Val Leu Ser Asp Asp Leu Ser He Phe Arg Asp Lys His Val Leu 
180 185 190 

He Val Glu Asp He Val Asp Thr Gly Phe Thr Leu Thr Glu Phe Gly 
195 200 205 

Glu Arg Leu Lys Ala Val Gly Pro Lys Ser Met Arg He Ala Thr Leu 

210 215 220 

Val Glu Lys Arg Thr Asp Arg Ser Asn Ser Leu Lys Gly Asp Phe Val 
225 230 235 240 

Gly Phe Ser He Glu Asp Val Trp He Val Gly Cys Cys Tyr Asp Phe 
245 250 255 

Asn Glu Met Phe Arg Asp Phe Asp His Val Ala Val Leu Ser Asp Ala 
260 265 270 
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Ala Arg Dys Lys Phe Glu I*ys 
275 

<210> 19 
<211> 459 
<212> DNA 

<213> Escheri cilia coli 

<220> 

<221> CDS 

<222> (1)..(456) 

<223> coding for xanthine-guanine phosphoribosyl 
transferase (gpt) 

<400> 19 

atg age gaa aaa tac ate gtc acc tgg gac atg ttg cag ate cat gca 48 

Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 
15 10 15 

cgt aaa etc gca age ega ctg atg cct tet gaa caa tgg aaa ggc att 96 
Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 
20 25 30 

att gee gta age cgt ggc ggt ctg gta ccg ggt gcg tta ctg gcg cgt 144 

He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 

35 40 45 

gaa ctg ggt att cgt cat gtc gat acc gtt tgt att tec age tac gat 192 

Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 

50 55 60 

cac gac aac cag cge gag ctt aaa gtg ctg aaa cgc gca gaa ggc gat 240 

His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 

65 70 75 80 

ggc gaa ggc ttc ate gtt att gat gac ctg gtg gat acc ggt ggt act 288 
Gly Glu Gly Phe He val He Asp Asp Leu Val Asp Thr Gly Gly Thr 
85 90 95 

gcg gtt gcg att cgt gaa atg tat cca aaa gcg cac ttt gtc acc ate 336 
Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 
100 105 110 

ttc gca aaa ccg get ggt cgt ccg ctg gtt gat gac tat gtt gtt gat 384 
Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 
115 120 125 

ate ccg caa gat acc tgg att gaa cag ccg tgg gat atg ggc gtc gta 432 
He Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

ttc gtc ccg eca ate tec ggt cgc taa 459 
Phe Val Pro Pro He Ser Gly Arg 
145 150 

<210> 20 
<211> 152 
<212> PRT 

<213> Escherichia coli 
<400> 20 

Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 
15 10 15 

Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 
20 25 30 
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He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 
35 40 45 

Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 
50 55 60 

His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 70 75 80 

Gly Glu Gly Phe He Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Plie Val Thx He 
100 105 110 

Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 

115 120 125 

He Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

Phe Val Pro Pro He Ser Gly Arg 
145 150 

<210> 21 
<211> 459 
<212> DNA 

<213> Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (456) 

<223> coding for xanthine-guanine phosphoribosyl 
transferase (gpt) 

<400> 21 

atg age gaa aaa tac ate gtc acc tgg gac atg ttg cag ate cat gea 48 
Met Ser Glu Lys Tyr He Val Thr Trp Asp Met Leu Gin He His Ala 
15 10 15 

cgt aaa etc gea age ega ctg atg cet tct gaa caa tgg aaa ggc att 96 
Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 
20 25 30 

att gee gta age cgt ggc ggt ctg gta ccg ggt gcg tta ctg gcg cgt 144 
He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 
35 40 45 

gaa ctg ggt att cgt cat gtc gat acc gtt tgt att tec age tac gat 192 
Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 
50 55 60 

cac gac aac cag cgc gag ctt aaa gtg ctg aaa cgc gea gaa ggc gat 240 
His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 70 75 80 

ggc gaa ggc ttc ate gtt att gat gac ctg gtg gat acc ggt ggt act 288 
Gly Glu Gly Phe He Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 

85 90 95 

gcg gtt gcg att cgt gaa atg tat cca aaa gcg cac ttt gtc ace ate 336 
Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 
100 105 110 

ttc gea aaa ccg get ggt cgt ccg ctg gtt gat gac tat gtt gtt gat 384 
Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 
115 120 125 
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ate ccg caa gat acc tgg att gaa cag ccg tgg gat atg ggc gtc gta 432 
lie Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 



ttc gtc ccg cca ate tec ggt cgc taa 
Pbe Val Pro Pro He Ser Gly Arg 
145 150 

<210> 22 
<211> 152 
<212> PRT 

<213> Escherichia coli 
<400> 22 

Met Ser Glu Lys Tyr lie Val Thr Trp Asp Met Leu Gin He His Ala 
15 10 15 

Arg Lys Leu Ala Ser Arg Leu Met Pro Ser Glu Gin Trp Lys Gly He 

20 25 30 

He Ala Val Ser Arg Gly Gly Leu Val Pro Gly Ala Leu Leu Ala Arg 
35 40 45 

Glu Leu Gly He Arg His Val Asp Thr Val Cys He Ser Ser Tyr Asp 
50 55 60 

His Asp Asn Gin Arg Glu Leu Lys Val Leu Lys Arg Ala Glu Gly Asp 
65 70 75 80 

Gly Glu Gly Phe He Val He Asp Asp Leu Val Asp Thr Gly Gly Thr 
85 90 95 

Ala Val Ala He Arg Glu Met Tyr Pro Lys Ala His Phe Val Thr He 
100 105 110 

Phe Ala Lys Pro Ala Gly Arg Pro Leu Val Asp Asp Tyr Val Val Asp 

115 120 125 

He Pro Gin Asp Thr Trp He Glu Gin Pro Trp Asp Met Gly Val Val 
130 135 140 

Phe Val Pro Pro He Ser Gly Arg 
145 150 



459 



<210> 23 
<211> 720 
<212> DNA 

<213> Escherichia coli 

<220> 

<221> CDS 

<222> (1) . . (717) 

<223> coding for purine nucleoside phosphorylase (deoD) 
<400> 23 

atg get acc cca cac att aat gca gaa atg ggc gat ttc get gac gta 
Met Ala Thr Pro His He Asn Ala Glu Met Gly Asp Phe Ala Asp Val 
15 10 15 

gtt ttg atg cca ggc gac ccg ctg cgt gcg aag tat att get gaa act 
Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr He Ala Glu Thr 
20 25 30 

ttc ett gaa gat gee cgt gaa gtg aac aac gtt cgc ggt atg ctg ggc 
Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 
35 40 45 
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ttc acc ggt act tac aaa ggc cgc aaa att tec gta atg ggt cac ggt 192 
Pile Thx Gly Tlir Tyr Lys Gly Arg Lys lie Ser Val Met Gly His Gly 
50 55 60 

atg ggt ate ccg tec tgc tec ate tac ace aaa gaa ctg ate ace gat 240 
Met Gly lie Pro Ser Cys Ser He Tyr Thr Lys Glu Leu He Thr Asp 
65 70 75 80 

ttc ggc gtg aag aaa att ate cgc gtg ggt tee tgt ggc gea gtt ctg 288 
Phe Gly Val Lys Lys He He Arg Val Gly Ser Cys Gly Ala Val Leu 
85 90 95 

ccg cac gta aaa ctg cgc gac gtc gtt ate ggt atg ggt gee tgc acc 336 
Pro His Val Lys Leu Arg Asp Val Val He Gly Met Gly Ala Cys Tlir 
100 105 110 

gat tec aaa gtt aac cgc ate cgt ttt aaa gac cat gac ttt gee get 384 
Asp Ser Lys Val Asn Arg He Arg Phe Lys Asp His Asp Phe Ala Ala 
115 120 125 

ate get gac ttc gac atg gtg cgt aac gca gta gat gca get aaa gea 432 
He Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 
130 135 140 

ctg ggt att gat get cgc gtg ggt aac ctg ttc tec get gac ctg ttc 480 
Leu Gly He Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 
145 150 155 160 

tac tct ccg gac ggc gaa atg ttc gac gtg atg gaa aaa tac ggc att 528 
Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly He 
165 170 175 

etc ggc gtg gaa atg gaa gcg get ggt ate tac ggc gtc get gea gaa 576 
Leu Gly Val Glu Met Glu Ala Ala Gly He Tyr Gly Val Ala Ala Glu 
180 185 190 

ttt ggc gcg aaa gee ctg ace ate tgc acc gta tct gac cac ate cgc 624 
Phe Gly Ala Lys Ala Leu Thr He Cys Thr Val Ser Asp His He Arg 
195 200 205 

act cac gag cag acc act gee get gag cgt cag act ace ttc aac gac 672 
Thr His Glu Gin Thr Thr Ala Ala Glu Arg Gin Thr Thr Phe Asn Asp 
210 215 220 

atg ate aaa ate gea ctg gaa tec gtt ctg ctg ggc gat aaa gag taa 720 
Met He Lys He Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 
225 230 235 

<210> 24 
<211> 239 

<212> PRT 

<213> Escherichia coli 
<400> 24 

Met Ala Thr Pro His He Asn Ala Glu Met Gly Asp Phe Ala Asp Val 
15 10 15 

Val Leu Met Pro Gly Asp Pro Leu Arg Ala Lys Tyr He Ala Glu Thr 
20 25 30 

Phe Leu Glu Asp Ala Arg Glu Val Asn Asn Val Arg Gly Met Leu Gly 
35 40 45 

Phe Thr Gly Thr Tyr Lys Gly Arg Lys He Ser Val Met Gly His Gly 

50 55 60 

Met Gly He Pro Ser Cys Ser He Tyr Thr Lys Glu Leu He Thr Asp 
65 70 75 80 



wo 2004/013333 PCT/EP2003/007877 

30 

Phe Gly Val Lys Lys He He Arg Val Gly Ser Cys Gly Ala Val Leu 
85 90 95 

Pro His Val Lys Leu Arg Asp Val Val He Gly Met Gly Ala Cys Thr 
100 105 110 

Asp Ser Lys Val Asn Arg He Arg Phe Lys Asp His Asp Phe Ala Ala 
115 120 125 

He Ala Asp Phe Asp Met Val Arg Asn Ala Val Asp Ala Ala Lys Ala 

130 135 140 

Leu Gly He Asp Ala Arg Val Gly Asn Leu Phe Ser Ala Asp Leu Phe 
145 150 155 160 

Tyr Ser Pro Asp Gly Glu Met Phe Asp Val Met Glu Lys Tyr Gly He 
165 170 175 

Leu Gly Val Glu Met Glu Ala Ala Gly He Tyr Gly Val Ala Ala Glu 
180 185 190 

Phe Gly Ala Lys Ala Leu Thr He Cys Thr Val Ser Asp His He Arg 
195 200 205 

Thr His Glu Gin Thr Thr Ala Ala Glu Arg Gin Thr Thr Phe Asn Asp 

210 215 220 

Met He Lys He Ala Leu Glu Ser Val Leu Leu Gly Asp Lys Glu 
225 230 235 



<210> 25 
<211> 1545 
<212> DNA 

<213> Burkholderia caryophylli 

<220> 

<221> CDS 

<222> (1) . . (1542) 

<223> coding for phosphonate monoester hydrolase (pehA) 
<400> 25 

atg acc aga aaa aat gtc ctg ctt ate gtc gtt gat caa tgg cga gca 48 
Met Thr Arg Lys Asn Val Leu Leu He Val Val Asp Gin Trp Arg Ala 
15 10 15 

gat ttt ate cct cac ctg atg egg geg gag ggg ege gaa cct tte ett 96 
Asp Phe He Pro His Leu Met Arg Ala Glu Gly Arg Glu Pro Phe Leu 
20 25 30 

aaa act ccc aat ctt gat cgt ctt tgc egg gaa ggc ttg aec tte ege 144 
Lys Thr Pro Asn Leu Asp Arg Leu Cys Arg Glu Gly Leu Thr Phe Arg 
35 40 45 

aat cat gtc aeg acg tgc gtg ccg tgt ggt ccg gca agg gea age ctg 192 
Asn His Val Thr Thr Cys Val Pro Cys Gly Pro Ala Arg Ala Ser Leu 

50 55 60 

ctg acg ggc etc tac ctg atg aac cac egg geg gtg cag aac act gtt 240 
Leu Thr Gly Leu Tyr Leu Met Asn His Arg Ala Val Gin Asn Thr Val 
65 70 75 80 

ccg ctt gac cag cgc cat eta aac ctt ggc aag gee ctg cgc gee att 288 
Pro Leu Asp Gin Arg His Leu Asn Leu Gly Lys Ala Leu Arg Ala He 
85 90 95 

ggc tac gat ccc geg etc att ggt tac ace acc acg aca cct gat ccg 336 
Gly Tyr Asp Pro Ala Leu He Gly Tyr Thr Thr Thr Thr Pro Asp Pro 
100 105 110 
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cgc aca acc tct gca agg gat ccg cgt ttc acg gtc ctg ggc gac ate 384 
Arg Thr Thr Ser Ala Arg Asp Pro Arg Phe Thr Val Leu Gly Asp He 

115 120 125 

atg gac ggc ttt cgt teg gtc ggc gca ttc gag ccc aat atg gag ggg 432 
Met Asp Gly Phe Arg Ser Val Gly Ala Phe Glu Pro Asn Met Glu Gly 

130 135 140 

tat ttt ggc tgg gtg gcg cag aac ggc ttc gaa ctg cca gag aac cgc 480 
Tyr Phe Gly Trp Val Ala Gin Asn Gly Phe Glu Leu Pro Glu Asn Arg 
145 150 155 160 

gaa gat ate tgg ctg ccg gaa ggt gaa cat tec gtt ccc ggt get acc 528 
Glu Asp He Trp Leu Pro Glu Gly Glu His Ser Val Pro Gly Ala Thr 
165 170 175 

gac aaa ccg teg cgc att ccg aag gaa ttt teg gat teg aca ttc ttc 576 
Asp Lys Pro Ser Arg He Pro Lys Glu Phe Ser Asp Ser Thr Phe Phe 
ISO 185 190 

acg gag cgc gee ctg aca tat ctg aag ggc agg gac ggc aag cct ttc 624 
Thr Glu Arg Ala Leu Thr Tyr Leu Lys Gly Arg Asp Gly Lys Pro Phe 

195 200 205 

ttc ctg eat ctt ggc tat tat cgc ccg eat ccg cct ttc gta gee tec 672 
Phe Leu His Leu Gly Tyr Tyr Arg Pro His Pro Pro Phe Val Ala Ser 

210 215 220 

gcg ccc tac cat gcg atg tac aaa gee gaa gat atg cct gcg cct ata 720 
Ala Pro Tyr His Ala Met Tyr Lys Ala Glu Asp Met Pro Ala Pro He 
225 230 235 240 

cgt gcg gag aat ccg gat gee gaa gcg gca cag cat ccg etc atg aag 768 
Arg Ala Glu Asn Pro Asp Ala Glu Ala Ala Gin His Pro Leu Met Lys 
245 250 255 

cac tat ate gac cac ate aga cgc ggc teg ttc ttc eat ggc gcg gaa 816 
His Tyr He Asp His He Arg Arg Gly Ser Phe Phe His Gly Ala Glu 

260 265 270 

ggc teg gga gea acg ctt gat gaa ggc gaa att cgc cag atg cgc get 864 
Gly Ser Gly Ala Thr Leu Asp Glu Gly Glu He Arg Gin Met Arg Ala 

275 280 285 

aca tat tge gga ctg ate acc gag ate gac gat tgt ctg ggg agg gtc 912 
Thr Tyr Cys Gly Leu He Thr Glu He Asp Asp Cys Leu Gly Arg Val 

290 295 300 

ttt gee tat etc gat gaa acc ggt cag tgg gac gac acg ctg att ate 960 
Phe Ala Tyr Leu Asp Glu Thr Gly Gin Trp Asp Asp Thr Leu He He 
305 310 315 320 

ttc aeg age gat eat ggc gaa eaa ctg ggc gat cat cac ctg etc ggc 1008 
Phe Thr Ser Asp His Gly Glu Gin Leu Gly Asp His His Leu Leu Gly 
325 330 335 

aag ate ggt tac aat gee gaa age ttc cgt att ccc ttg gtc ata aag 1056 
Lys He Gly Tyr Asn Ala Glu Ser Phe Arg He Pro Leu Val He Lys 

340 345 350 

gat gcg gga eag aac egg cac gee ggc cag ate gaa gaa ggc ttc tee 1104 
Asp Ala Gly Gin Asn Arg His Ala Gly Gin He Glu Glu Gly Phe Ser 
355 360 365 

gaa age ate gac gtc atg ccg ace ate etc gaa tgg ctg ggc ggg gaa 1152 
Glu Ser He Asp Val Met Pro Thr He Leu Glu Trp Leu Gly Gly Glu 
370 375 380 
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acg cct cgc gcc tgc gac ggc cgt teg ctg ttg ccg ttt ctg get gag 1200 
Thr Pro Arg Ala Cys Asp Gly Arg Ser Leu Leu Pro Phe Leu Ala Glu 
385 390 395 400 

gga aag ccc tec gac tgg cgc acg gaa eta cat tac gag ttc gat ttt 1248 
Gly Lys Pro Ser Asp Trp Arg Thr Glu Leu His Tyr Glu Phe Asp Phe 
405 410 415 

cgc gat gtc ttc tac gat eag ccg cag aac teg gtc eag ctt tec cag 1296 
Arg Asp Val Phe Tyr Asp Gin Pro Gin Asn Ser Val Gin Leu Ser Gin 

420 425 430 

gat gat tgc age etc tgt gtg ate gag gac gaa aac tac aag tac gtg 1344 
Asp Asp Cys Ser Leu Cys Val lie Glu Asp Glu Asn Tyr Lys Tyr Val 
435 440 445 

eat ttt gcc gee ctg ccg ccg ctg ttc ttc gat ctg aag gca gac ccg 1392 
His Phe Ala Ala Leu Pro Pro Leu Phe Phe Asp Leu Lys Ala Asp Pro 
450 455 460 

cat gaa ttc age aat ctg get ggc gat cct get tat gcg gcc etc gtt 1440 
His Glu Phe Ser Asn Leu Ala Gly Asp Pro Ala Tyr Ala Ala Leu Val 
465 470 475 480 

cgt gac tat gee cag aag gca ttg teg tgg ega ctg tet cat gcc gac 1488 
Arg Asp Tyr Ala Gin Lys Ala Leu Ser Trp Arg Leu Ser His Ala Asp 
485 490 495 

egg aca etc ace eat tac aga tec age ccg caa ggg ctg aca acg cgc 1536 
Arg Thr Leu Thr His Tyr Arg Ser Ser Pro Gin Gly Leu Thr Thr Arg 
500 505 510 

aac cat tga 1545 
Asn His 

<210> 26 
<211> 514 
<212> PRT 

<213> Burkholderia caryophylli 
<400> 26 

Met Thr Arg Lys Asn Val Leu Leu lie Val Val Asp Gin Trp Arg Ala 
15 10 15 

Asp Phe lie Pro His Leu Met Arg Ala Glu Gly Arg Glu Pro Phe Leu 
20 25 30 

Lys Thr Pro Asn Leu Asp Arg Leu Cys Arg Glu Gly Leu Thr Phe Arg 
35 40 45 

Asn His Val Thr Thr Cys Val Pro Cys Gly Pro Ala Arg Ala Ser Leu 
50 55 60 

Leu Thr Gly Leu Tyr Leu Met Asn His Arg Ala Val Gin Asn Thr Val 
65 70 75 80 

Pro Leu Asp Gin Arg His Leu Asn Leu Gly Lys Ala Leu Arg Ala lie 
85 90 95 

Gly Tyr Asp Pro Ala Leu lie Gly Tyr Thr Thr Thr Thr Pro Asp Pro 
100 105 110 

Arg Thr Thr Ser Ala Arg Asp Pro Arg Phe Thr Val Leu Gly Asp lie 
115 120 125 

Met Asp Gly Phe Arg Ser Val Gly Ala Phe Glu Pro Asn Met Glu Gly 
130 135 140 
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Tyr Phe Gly Trp Val Ala Gin Asn Gly Plae Glu Leu Pro Glu Asn Arg 
145 150 155 160 

Glu Asp lie Trp Leu Pro Glu Gly Glu His Ser Val Pro Gly Ala Thr 
165 170 175 

ASP Lys Pro Ser Arg He Pro Lys Glu Plie Ser Asp Ser Thr Phe Phe 

180 185 190 

Thr Glu Arg Ala Leu Thr Tyr Leu Lys Gly Arg Asp Gly Lys Pro Phe 
195 200 205 

Phe Leu His Leu Gly Tyr Tyr Arg Pro His Pro Pro Phe Val Ala Ser 

210 215 220 

Ala Pro Tyr His Ala Met Tyr Lys Ala Glu Asp Met Pro Ala Pro He 
225 230 235 240 

Arg Ala Glu Asn Pro Asp Ala Glu Ala Ala Gin His Pro Leu Met Lys 
245 250 255 

His Tyr He Asp His He Arg Arg Gly Ser Phe Phe His Gly Ala Glu 

260 265 270 

Gly Ser Gly Ala Thr Leu Asp Glu Gly Glu He Arg Gin Met Arg Ala 
275 280 285 

Thr Tyr Cys Gly Leu He Thr Glu He Asp Asp Cys Leu Gly Arg Val 

290 295 300 

Phe Ala Tyr Leu Asp Glu Thr Gly Gin Trp Asp Asp Thr Leu He He 
305 310 315 320 

Phe Thr Ser Asp His Gly Glu Gin Leu Gly Asp His His Leu Leu Gly 
325 330 335 

Lys He Gly Tyr Asn Ala Glu Ser Phe Arg He Pro Leu Val He Lys 

340 345 350 

Asp Ala Gly Gin Asn Arg His Ala Gly Gin He Glu Glu Gly Phe Ser 

355 360 365 

Glu Ser He Asp Val Met Pro Thr He Leu Glu Trp Leu Gly Gly Glu 

370 375 380 

Thr Pro Arg Ala Cys Asp Gly Arg Ser Leu Leu Pro Phe Leu Ala Glu 
385 390 395 400 

Gly Lys Pro Ser Asp Trp Arg Thr Glu Leu His Tyr Glu Phe Asp Phe 
405 410 415 

Arg Asp Val Phe Tyr Asp Gin Pro Gin Asn Ser Val Gin Leu Ser Gin 
420 425 430 

Asp Asp Cys Ser Leu Cys Val He Glu Asp Glu Asn Tyr Lys Tyr Val 
435 440 445 

His Phe Ala Ala Leu Pro Pro Leu Phe Phe Asp Leu Lys Ala Asp Pro 

450 455 460 

His Glu Phe Ser Asn Leu Ala Gly Asp Pro Ala Tyr Ala Ala Leu Val 
465 470 475 480 

Arcr Asp Tyr Ala Gin Lys Ala Leu Ser Trp Arg Leu Ser His Ala Asp 
485 490 495 

Arg Thr Leu Thr His Tyr Arg Ser Ser Pro Gin Gly Leu Thr Thr Arg 
500 505 510 

Asn His 
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<210> 27 
<211> 2250 
<212> DNA 

<213> Agrobacteriim rhizogenes 

<220> 

<221> CDS 

<222> (1)..(2247) 

<223> coding for tryptophane oxygenase (auxl) 
<400> 27 

atg get gga tec tec ttc aca ttg cca tea act ggc tea geg cec ctt 48 
Met Ala Gly Ser Ser Phe Thr Leu Pro Ser Thr Gly Ser Ala Pro Leu 
15 10 15 

gat atg atg ctt ate gat gat tea gat ctg ctg caa ttg ggt etc cag 96 
Asp Met Met Leu lie Asp Asp Ser Asp Leu Leu Gin Leu Gly Leu Gin 
20 25 30 

cag gta ttc teg aag egg tac aca gag aca eeg cag tea ege tac aaa 144 
Gin Val Phe Ser Lys Arg Tyr Thr Glu Thr Pro Gin Ser Arg Tyr Lys 
35 40 45 

ctg acc agg agg get tet cca gae gtc tea tct ggc gaa ggc aat gtg 192 
Leu Thr Arg Arg Ala Ser Pro Asp Val Ser Ser Gly Glu Gly Asn Val 
50 55 60 

cat gee ctt geg ttc ata tat gtc aac get gag aeg ttg cag atg ate 240 
His Ala Leu Ala Phe lie Tyr Val Asn Ala Glu Thr Leu Gin Met lie 
65 70 75 80 

aaa aac get ega teg eta ace gaa geg aac ggc gtc aaa gat ctt gtc 288 
Lys Asn Ala Arg Ser Leu Thr Glu Ala Asn Gly Val Lys Asp Leu Val 

85 90 95 

gee ate gae gtt eeg cca ttt ega aac gae ttc tea aga geg eta etc 336 
Ala lie Asp Val Pro Pro Phe Arg Asn Asp Phe Ser Arg Ala Leu Leu 
100 105 110 

ctt caa gtg ate aac ttg ttg gga aac aac ega aat gee gat gae gat 384 
Leu Gin Val lie Asn Leu Leu Gly Asn Asn Arg Asn Ala Asp Asp Asp 
115 120 125 

ctt agt cac ttc ata gea gtt get etc cca aac age gee ege tct aag 432 
Leu Ser His Phe He Ala Val Ala Leu Pro Asn Ser Ala Arg Ser Lys 
130 135 140 

ate eta acc acg gca ccg ttc gaa gga age ttg tea gaa aac ttc agg 480 
He Leu Thr Thr Ala Pro Phe Glu Gly Ser Leu Ser Glu Asn Phe Arg 
145 150 155 160 

ggg ttc ccg ate act cgt gaa gga aat gtg gca tgt gaa gtg eta gee 528 
Gly Phe Pro He Thr Arg Glu Gly Asn Val Ala Cys Glu Val Leu Ala 
165 170 175 

tat ggg aat aac ttg atg ccc aag gee tgc tec gat tec ttt cca acc 576 
Tyr Gly Asn Asn Leu Met Pro Lys Ala Cys Ser Asp Ser Phe Pro Thr 
180 185 190 

gtg gat ctt ctt tat gae tat ggc aag ttc ttc gag agt tgc geg gcc 624 
Val Asp Leu Leu Tyr Asp Tyr Gly Lys Phe Phe Glu Ser Cys Ala Ala 
195 200 205 

gat gga cgt ate ggt tat ttt ect gaa ggc gtt acg aaa ect aaa gtg 672 
Asp Gly Arg He Gly Tyr Phe Pro Glu Gly Val Thr Lys Pro Lys Val 
210 215 220 



wo 2004/013333 PCT/EP2003/007877 

35 

get ata att ggc gca ggc ttt tec ggg etc gtt gca gcg age gaa eta 720 

Ala lie lie Gly Ala Gly Phe Ser Gly Leu Val Ala Ala Ser Glu Leu 

225 230 235 240 

Gtt cat gca ggg gta gac gat gtt acg gtg tat gag gcg agt gat egg 768 
Leu His Ala Gly Val Asp Asp Val Thr Val Tyr Glu Ala Ser Asp Arg 
245 250 255 

ctt gga gga aag eta tgg tea cac gga ttt aag agt get eca aat gtg 816 
Leu Gly Gly Lys Leu Trp Ser His Gly Phe Lys Ser Ala Pro Asn Val 
260 265 270 

ata gee gag atg ggg gee atg cgt ttt ceg cga agt gaa tea tgc ttg 864 
lie Ala Glu Met Gly Ala Met Arg Phe Pro Arg Ser Glu Ser Cys Leu 
275 280 285 

ttc ttc tat etc aaa aag cac gga ctg gae tec gtt ggt etg tte ceg 912 
Phe Phe Tyr Leu Lys Lys His Gly Leu Asp Ser Val Gly Leu Phe Pro 
290 295 300 

aat ceg gga agt gtc gat ace gca ttg tte tac agg ggc cgt caa tat 960 
Asn Pro Gly Ser Val Asp Thr Ala Leu Phe Tyr Arg Gly Arg Gin Tyr 
305 310 315 320 

ate tgg aaa gcg gga gag gag cea ceg gag ctg ttt cgt cgt gtg cac 1008 
lie Trp Lys Ala Gly Glu Glu Pro Pro Glu Leu Phe Arg Arg Val His 
325 330 335 

cat gga tgg cge gca ttt ttg caa gat ggc tat etc cat gat gga gtc 1056 
His Gly Trp Arg Ala Phe Leu Gin Asp Gly Tyr Leu His Asp Gly Val 
340 345 350 

atg ttg gcg tea ceg tta gca att gtt gae gee ttg aat tta ggg cat 1104 
Met Leu Ala Ser Pro Leu Ala He Val Asp Ala Leu Asn Leu Gly His 
355 360 365 

eta cag eag gcg eat ggc ttc tgg caa tet tgg etc aca tat ttt gag 1152 
Leu Gin Gin Ala His Gly Phe Txp Gin Ser Trp Leu Thr Tyr Phe Glu 
370 375 380 

cga gag tet ttc tct tet ggc ate gaa aaa atg tte ttg ggc aat cat 1200 
Arg Glu Ser Phe Ser Ser Gly He Glu Lys Met Phe Leu Gly Asn His 
385 390 395 400 

ect ceg ggg ggt gaa caa tgg aat tec eta gat gae ttg gat ctt ttc 1248 
Pro Pro Gly Gly Glu Gin Trp Asn Ser Leu Asp Asp Leu Asp Leu Phe 
405 410 415 

aaa gcg ctg ggt att gga tec ggc gga tte ggc ect gta ttt gaa agt 1296 
Lys Ala Leu Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser 
420 425 430 

ggg ttt ate gag ate ctt cge tta gtc gtc aac ggg tat gag gat aac 1344 
Gly Phe He Glu He Leu Arg Leu Val Val Asn Gly Tyr Glu Asp Asn 
435 440 445 

gtg egg ctg agt tac gaa gga att tct gag ctg ect cat agg ate gee 1392 
Val Arg Leu Ser Tyr Glu Gly He Ser Glu Leu Pro His Arg He Ala 
450 455 460 

tea cag gta att aac ggc aga tct att cge gag cgt aca att cac gtt 
Ser Gin Val He Asn Gly Arg Ser He Arg Glu Arg Thr He His Val 
465 470 475 480 

caa gtc gag cag att gat aga gag gag gat aaa ata aat ate aag ate 1488 
Gin Val Glu Gin He Asp Arg Glu Glu Asp Lys He Asn He Lys He 
485 490 495 
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aaa gga gga aag gtt gag gtc tat gat cga gta ctg gtt aca tec ggg 1536 

Lys Gly Gly Lys Val Glu Val Tyr Asp Arg Val Leu Val Thr Ser Gly 
500 505 510 

ttt gcg aac ate gaa atg cgc cat etc ctg aca tea age aac gca ttc 1584 
Phe Ala Asn lie Glu Met Arg His Leu Leu Thr Ser Ser Asn Ala Phe 

515 520 525 

ttc cat gca gat gta age cat gca ata ggg aac agt cat atg act ggt 1632 
Phe His Ala Asp Val Ser His Ala lie Gly Asn Ser His Met Thr Gly 
530 535 540 

gcg tea aaa ctg ttc ttg ctg act aac gaa aaa ttc tgg eta caa cat 1680 
Ala Ser Lys Leu Phe Leu Leu Thr Asn Glu Lys Phe Trp Leu Gin His 
545 550 555 560 

cat ttg eca teg tgc ata etc acc ace ggc gtt gca aag gca gtt tat 1728 
His Leu Pro Ser Cys lie Leu Thr Thr Gly Val Ala Lys Ala Val Tyr 
565 570 575 

tgc tta gac tat gat ccg cga gat cca age ggc aaa gga ctg gtg ttg 1776 
Cys Leu Asp Tyr Asp Pro Arg Asp Pro Ser Gly Lys Gly Leu Val Leu 
580 585 590 

ata age tat act tgg gag gat gac tea cat aag etc eta gee gtc cec 1824 
lie Ser Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro 
595 600 605 

gac aaa aga gaa agg ttc gca teg ctg eag cgc gat att ggg agg gca 1872 
Asp Lys Arg Glu Arg Phe Ala Ser Leu Gin Arg Asp lie Gly Arg Ala 
610 615 620 

ttc cca gat ttt gee aag cac eta act cet gca gac ggg aac tat gat 1920 
Phe Pro Asp Phe Ala Lys His Leu Thr Pro Ala Asp Gly Asn Tyr Asp 
625 630 635 640 

gat aat ate gtt caa eat gat tgg ctg act gat cec cac get ggc gga 1968 
Asp Asn lie Val Gin His Asp Trp Leu Thr Asp Pro His Ala Gly Gly 
645 650 655 

gcg ttt aaa ctg aac cgc aga ggc aac gac gta tat tea gaa agg ett 2016 
Ala Phe Lys Leu Asn Arg Arg Gly Asn Asp Val Tyr Ser Glu Arg Leu 
660 665 670 

ttc ttt eag cec ttt gac gta atg eat cec gcg gac gat aag gga ett 2064 
Phe Phe Gin Pro Phe Asp Val Met His Pro Ala Asp Asp Lys Gly Leu 
675 680 685 

tac ttg gee ggt tgt age tgt tec ttc acc gga ggg tgg gtt eat ggt 2112 
Tyr Leu Ala Gly Cys Ser Cys Ser Phe Thr Gly Gly Trp Val His Gly 
690 695 700 

gee att eag ace gca tgc aac get aeg tgt gcg ate att tat ggt tec 2160 
Ala He Gin Thr Ala Cys Asn Ala Thr Cys Ala He He Tyr Gly Ser 
705 710 715 720 

gga cac ctg caa gag eta ate cac tgg cga cac etc aaa gaa ggt aat 2208 
Gly His Leu Gin Glu Leu He His Trp Arg His Leu Lys Glu Gly Asn 
725 730 735 

cca ctg gcg cac get tgg aag egg tat agg tat caa gcg tga 2250 
Pro Leu Ala His Ala Trp Lys Arg Tyr Arg Tyr Gin Ala 
740 745 



<210> 28 
<211> 749 
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<212> PRT 

<213> Agrobacterium rhizogenes 
<400> 28 

Met Ala Gly Ser Ser Phe Thr Leu Pro Ser Thr Gly Ser Ala Pro Leu 

15 10 15 

Asp Met Met Leu lie Asp Asp Ser Asp Leu Leu Gin Leu Gly Leu Gin 
20 25 30 

Gin Val Phe Ser Lys Arg Tyr Thr Glu Thr Pro Gin Ser Arg Tyr Lys 
35 40 45 

Leu Thr Arg Arg Ala Ser Pro Asp Val Ser Ser Gly Glu Gly Asn Val 
50 55 60 

His Ala Leu Ala Phe lie Tyr Val Asn Ala Glu Thr Leu Gin Met lie 
65 70 75 80 

Lys Asn Ala Arg Ser Leu Thr Glu Ala Asn Gly Val Lys Asp Leu Val 
85 90 95 

Ala He Asp Val Pro Pro Phe Arg Asn Asp Phe Ser Arg Ala Leu Leu 
100 105 110 

Leu Gin Val He Asn Leu Leu Gly Asn Asn Arg Asn Ala Asp Asp Asp 
115 120 125 

Leu Ser His Phe He Ala Val Ala Leu Pro Asn Ser Ala Arg Ser Lys 

130 135 140 

He Leu Thr Thr Ala Pro Phe Glu Gly Ser Leu Ser Glu Asn Phe Arg 
145 150 155 160 

Gly Phe Pro He Thr Arg Glu Gly Asn Val Ala Cys Glu Val Leu Ala 

165 170 175 

Tyr Gly Asn Asn Leu Met Pro Lys Ala Cys Ser Asp Ser Phe Pro Thr 
ISO 185 190 

Val Asp Leu Leu Tyr Asp Tyr Gly Lys Phe Phe Glu Ser Cys Ala Ala 
195 200 205 

Asp Gly Arg He Gly Tyr Phe Pro Glu Gly Val Thr Lys Pro Lys Val 
210 215 220 

Ala He He Gly Ala Gly Phe Ser Gly Leu Val Ala Ala Ser Glu Leu 
225 230 235 240 

Leu His Ala Gly Val Asp Asp Val Thr Val Tyr Glu Ala Ser Asp Arg 
245 250 255 

Leu Gly Gly Lys Leu Trp Ser His Gly Phe Lys Ser Ala Pro Asn Val 
260 265 270 

He Ala Glu Met Gly Ala Met Arg Phe Pro Arg Ser Glu Ser Cys Leu 
275 280 285 

Phe Phe Tyr Leu Lys Lys His Gly Leu Asp Ser Val Gly Leu Phe Pro 
290 295 300 

Asn Pro Gly Ser Val Asp Thr Ala Leu Phe Tyr Arg Gly Arg Gin Tyr 
305 310 315 320 

He Trp Lys Ala Gly Glu Glu Pro Pro Glu Leu Phe Arg Arg Val His 
325 330 335 

His Gly Trp Arg Ala Phe Leu Gin Asp Gly Tyr Leu His Asp Gly Val 
340 345 350 
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Met Leu Ala Ser Pro Leu Ala lie Val Asp Ala Leu Asn Leu Gly His 

355 360 365 

Leu Gin Gin Ala His Gly Phe Trp Gin Ser Txp Leu Thr Tyr Phe Glu 
370 375 380 

Arg Glu Ser Phe Ser Ser Gly lie Glu Lys Met Phe Leu Gly Asn His 
385 390 395 400 

Pro Pro Gly Gly Glu Gin Trp Asn Ser Leu Asp Asp Leu Asp Leu Phe 
405 410 415 

Lys Ala Leu Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser 
420 425 430 

Gly Phe He Glu He Leu Arg Leu Val Val Asn Gly Tyr Glu Asp Asn 
435 440 445 

Val Arg Leu Ser Tyr Glu Gly He Ser Glu Leu Pro His Arg He Ala 

450 455 460 

Ser Gin Val He Asn Gly Arg Ser He Arg Glu Arg Thr He His Val 
465 470 475 480 

Gin Val Glu Gin He Asp Arg Glu Glu Asp Lys He Asn He Lys He 
485 490 495 

Lys Gly Gly Lys Val Glu Val Tyr Asp Arg Val Leu Val Thr Ser Gly 
500 505 510 

Phe Ala Asn He Glu Met Arg His Leu Leu Thr Ser Ser Asn Ala Phe 
515 520 525 

Phe His Ala Asp Val Ser His Ala He Gly Asn Ser His Met Thr Gly 
530 535 540 

Ala Ser Lys Leu Phe Leu Leu Thr Asn Glu Lys Phe Trp Leu Gin His 
545 550 555 560 

His Leu Pro Ser Cys He Leu Thr Thr Gly Val Ala Lys Ala Val Tyr 
565 570 575 

Cys Leu Asp Tyr Asp Pro Arg Asp Pro Ser Gly Lys Gly Leu Val Leu 
580 585 590 

He Ser Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro 
595 600 605 

Asp Lys Arg Glu Arg Phe Ala Ser Leu Gin Arg Asp He Gly Arg Ala 
610 615 620 

Phe Pro Asp Phe Ala Lys His Leu Thr Pro Ala Asp Gly Asn Tyr Asp 

625 630 635 640 

Asp Asn He Val Gin His Asp Trp Leu Thr Asp Pro His Ala Gly Gly 
645 650 655 

Ala Phe Lys Leu Asn Arg Arg Gly Asn Asp Val Tyr Ser Glu Arg Leu 
660 665 670 

Phe Phe Gin Pro Phe Asp Val Met His Pro Ala Asp Asp Lys Gly Leu 
675 680 685 

Tyr Leu Ala Gly Cys Ser Cys Ser Phe Thr Gly Gly Trp Val His Gly 
690 695 700 

Ala He Gin Thr Ala Cys Asn Ala Thr Cys Ala He He Tyr Gly Ser 
705 710 715 720 

Gly His Leu Gin Glu Leu He His Trp Arg His Leu Lys Glu Gly Asn 
725 730 735 
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Pro Leu Ala His Ala Trp Lys Arg Tyr Arg Tyr Gin Ala 
740 745 



<210> 29 
<211> 1401 
<212> DNA 

<213> Agrobacterium rhizogenes 

<220> 

<221> CDS 

<222> (1>..(1398) 

<223> coding for indole acetamide hydrolase 

atg°gtg^acc etc tec teg ate acc gag acg ctt aaa tgt etc agg gaa 48 
Met val Thr Leu Ser Ser lie Thr Glu Thr Leu Lys Cys Leu Arg Glu 

15 10 15 

aga aaa tac teg tgc ttt gag tta ate gaa acg ata ata gcc cgc tgt 
Arg Lys Tyr Ser Cys Phe Glu Leu lie Glu Thr lie lie Ala Arg Cys 

20 25 30 

gaa gca gca aga tec tta aac gcc ttt ctg gaa ace gac tgg gcg cae 
Glu Ala Ala Arg Ser Leu Asn Ala Phe Leu Glu Thr Asp Trp Ala His 

35 40 ^5 

eta egg tgg act gcc age aaa ate gat caa cac gga ggt gee ggt gtt 
Leu Arg Trp Thr Ala Ser Lys He Asp Gin His Gly Gly Ala Gly Val 

50 55 60 

ggc eta get ggc gtt ecc eta tgc ttt aaa gcg aat att gcg aca ggc 
Gly Leu Ala Gly Val Pro Leu Cys Phe Lys Ala Asn lie Ala Thr Gly 

agg tte gcc gcg ace get ggt acg cea ggc tta eag aac cae aaa ecc 
Ara Phe Ala Ala Thr Ala Gly Thr Pro Gly Leu Gin Asn His Lys Pro 

85 90 95 

aag acg ect gcc gga gtt gea cga caa ctt etc gcg get ggg gca ctg 
LYS Thr Pro Ala Gly Val Ala Arg Gin Leu Leu Ala Ala Gly Ala Leu 

100 105 110 

cet ggc get teg gga aac atg cae gaa ttg tet ttt ggg ate acg age 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 125 

aac aac tte gee aca ggc gcc gta cga aac ccg tgg aac cct agt etc 
Asn Asn Phe Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

ate cca ggg gga tea agt ggg ggt gtg gee gee gcg gtg gee ggc cga 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Gly Arg 
145 150 155 160 

ttg atg ctg ggc ggc gtc gga act gac acg gga gcg teg gte cgt tta 
Leu Met Leu Gly Gly Val Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

ccg gcc gee ttg tgc ggc gtg gtg ggg ttt cgt cet ace gtg ggg cga 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Val Gly Arg 

180 185 190 

tat cea acg gac gga ata gtt ccg gta age cec ace egg gac acc cet 
Tyr Pro Thr Asp Gly He Val Pro Val Ser Pro Thr Arg Asp Thr Pro 
195 200 205 
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ctg teg taa 
Leu Ser 
465 



816 



ggc gtt ate gca eag aat gtt ccg gac gtg att ctt ctt gac ggt ate 672 
Gly Val He Ala Gin T^n Val Pro Asp Val He Leu Leu Asp Gly He 

210 215 220 

att tge ggg aga ecg ccg gtt aat caa acg gtc cgc ctg aag ggg ctg 720 
He Cys Gly Arg Pro Pro Val Asn Gin Thr Val Arg Leu Lys Gly Leu 
225 230 235 240 

cgt ata gge ttg cca ace get tac ttt tae aac gac ctg gag ecc gat 768 
Arg He Gly Leu Pro Thr Ala Tyr Phe Tyr Asn Asp Leu Glu Pro Asp 

245 250 255 

gtc gcc tta gca gee gag acg att ate aga gtt ctg gca cgc aaa gat 
Val Ala Leu Ala Ala Glu Thr He He Arg Val Leu Ala Arg Lys Asp 
260 265 270 

gtt act ttt gtt gaa gca gat att cet gat tta gcg cat cac aat gaa 864 
Val Thr Phe Val Glu Ala Asp He Pro Asp Leu Ala His His Asn Glu 
275 280 285 

ggg gtc age ttt ccg act gcc ate tac gaa ttt ccg ttg tec ctt gaa 912 
Gly Val Ser Phe Pro Thr Ala He Tyr Glu Phe Pro Leu Ser Leu Glu 
290 295 300 

cat tat att cag aac ttc gta gag ggt gtt tec ttt tet gag gtt gtc 960 
His Tyr He Gin Asn Phe Val Glu Gly Val Ser Phe Ser Glu Val Val 
305 310 315 320 

aga gcg att cgc agt ccg gat gtt gca agt att etc aat gca caa etc 
Arg Ala He Arg Ser Pro Asp Val Ala Ser He Leu Asn Ala Gin Leu 
325 330 335 

teg gat aat ctt att tec aaa age gag tat tgt ctg gcg cga cgt ttt 1056 
Ser Asp Asn Leu He Ser Lys Ser Glu Tyr Cys Leu Ala Arg Arg Phe 
340 345 350 

ttc aga ccg aga etc caa gcg gcc tac cac agt tac ttc aag gcg cat 1104 
Phe Arg Pro Arg Leu Gin Ala Ala Tyr His Ser Tyr Phe Lys Ala His 
355 360 365 



1008 



cag eta gat gca att ctt ttc cca aca get ccg ttg aca gcc aag cca 1152 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

att ggc cat gat eta teg gtg att cac aat ggc tea atg acc gat acc 1200 
He Gly His Asp Leu Ser Val He His Asn Gly Ser Met Thr Asp Thr 
385 390 395 400 

ttt aaa ate ttc gtg egg aat gta gat ccc age agt aat gcg gge ctg 1248 
Phe Lys He Phe Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

ccg ggc eta agt ctt ccc gtt tet ctt agt tec aac ggt ctg cet att 
Pro Gly Leu Ser Leu Pro Val Ser Leu Ser Ser Asn Gly Leu Pro He 
420 425 430 

ggc atg gaa ate gat ggc tet gca age teg gat gaa cgt ctg tta gca 1344 
Gly Met Glu He Asp Gly Ser Ala Ser Ser Asp Glu Arg Leu Leu Ala 
435 440 445 

att gga eta gcg ata gaa gaa gca ata gac ttt agg cat cgt ccg act 1392 
He Gly Leu Ala He Glu Glu Ala He Asp Phe Arg His Arg Pro Thr 
450 455 460 



1296 
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<210> 30 
<211> 466 
<212> PRT 

<213> Agrobacterium rhizogenes 
<400> 30 

Met Val Thr Leu Ser Ser He Thr Glu Thr Leu Lys Cys Leu Arg Glu 
15 10 15 

Ara Lys OVr Ser Cys Phe Glu Leu He Glu Thr He He Ala Arg Cys 

20 .25 30 

Glu Ala Ala Arg Ser Leu Asn Ala Phe Leu Glu Thr Asp Trp Ala His 

35 40 45 

Leu Arg Trp Thr Ala Ser Lys He Asp Gin His Gly Gly Ala Gly Val 

50 55 60 

Gly Leu Ala Gly Val Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

Arg Phe Ala Ala Thr Ala Gly Thr Pro Gly Leu Gin Asn His Lys Pro 

85 90 95 

Lys Thr Pro Ala Gly Val Ala Arg Gin Leu Leu Ala Ala Gly Ala Leu 

100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 125 

Asn Asn Phe Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Gly Arg 
145 150 155 160 

Leu Met Leu Gly Gly Val Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Val Gly Arg 

180 185 190 

Tyr Pro Thr Asp Gly He Val Pro Val Ser Pro Thr Arg Asp Thr Pro 

195 200 205 

Gly Val He Ala Gin Asn Val Pro Asp Val He Leu Leu Asp Gly He 

210 215 220 

He Cys Gly Arg Pro Pro Val Asn Gin Thr Val Arg Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Ala Tyr Phe Tyr Asn Asp Leu Glu Pro Asp 
245 250 255 

Val Ala Leu Ala Ala Glu Thr He He Arg Val Leu Ala Arg Lys Asp 

260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro Asp Leu Ala His His Asn Glu 

275 280 285 

Gly Val Ser Phe Pro Thr Ala He Tyr Glu Phe Pro Leu Ser Leu Glu 

290 295 300 

His Tyr He Gin Asn Phe Val Glu Gly Val Ser Phe Ser Glu Val Val 
305 310 315 320 

Arg Ala He Arg Ser Pro Asp Val Ala Ser He Leu Asn Ala Gin Leu 
325 330 335 

Ser Asp Asn Leu He Ser Lys Ser Glu Tyr Cys Leu Ala Arg Arg Phe 
340 345 350 
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Phe Arg Pro Arg Leu Gin Ala Ala Tyr His Ser Tyr Phe Lys Ala His 
355 360 365 

Gin Leu Asp Ala lie Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

He Gly His Asp Leu Ser Val He His Asn Gly Ser Met Thr Asp Thr 
385 390 395 400 

Phe Lys He Phe Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Val Ser Leu Ser Ser Asn Gly Leu Pro He 

420 425 430 

Gly Met Glu He Asp Gly Ser Ala Ser Ser Asp Glu Arg Leu Leu Ala 
435 440 445 

He Gly Leu Ala He Glu Glu Ala He Asp Phe Arg His Arg Pro Thr 
450 455 460 

Leu Ser 
465 



<210> 31 
<211> 2268 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1) . . (2265) 

<223> coding for tryptophan monooxygenase 
<400> 31 

atg tea get tea cct etc ctt gat aac cag tgc gat cat ttc tct ace 48 
Met Ser Ala Ser Pro Leu Leu Asp Asn Gin Cys Asp His Phe Ser Thr 
15 10 15 

aaa atg gtg gat ctg ata atg gtc gat aag get gat gaa ttg gac egc 96 
Lys Met Val Asp Leu He Met Val Asp Lys Ala Asp Glu Leu Asp Arg 
20 25 30 

agg gtt tec gat gee ttc tea gaa egt gaa get tct agg gga agg agg 144 
Arg Val Ser Asp Ala Phe Ser Glu Arg Glu Ala Ser Arg Gly Arg Arg 
35 40 45 

att act caa ate tee gge gag tgc age get ggg tta get tgc aaa agg 192 
He Thr Gin He Ser Gly Glu Cys Ser Ala Gly Leu Ala Cys Lys Arg 
50 55 60 

ctg gee gac ggt cgc ttt ccc gag ate tea act ggt gag aag gta gea 240 
Leu Ala Asp Gly Arg Phe Pro Glu He Ser Thr Gly Glu Lys Val Ala 
65 70 75 80 

gee etc tec get tac ate tat gtt ggc aag gaa att ctg ggg egg ata 288 
Ala Leu Ser Ala Tyr He Tyr Val Gly Lys Glu He Leu Gly Arg He 
85 90 95 

ctt gaa teg gaa cct tgg gcg cga gea aga gtg agt ggt etc gtt gcc 336 
Leu Glu Ser Glu Pro Trp Ala Arg Ala Arg Val Ser Gly Leu Val Ala 
100 105 110 



ate gac ctt gea eca ttt tgt atg gat ttc tec gaa gea caa ctt etc 
He Asp Leu Ala Pro Phe Cys Met Asp Phe Ser Glu Ala Gin Leu Leu 
115 120 125 
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480 



528 



caa acc ctg ttt ttg ctg age ggt aaa aga tgt gca tec age gat ctt 432 
Gin Tlir Leu Phe Leu Leu Ser Gly Lys Arg Cys Ala Ser Ser Asp Leu 

130 135 140 

agt cat ttc gtg gcc att tea ate tct aag act gee ege tec ega ace 
Ser His Phe Val Ala lie Ser lie Ser Lys Thr Ala Arg Ser Arg Tlir 
145 150 155 160 

ctg caa atg ccg ceg tac gag aaa ggc acg acg aaa cgc gtt ace ggg 
Leu Gin Met Pro Pro Tyr Glu Lys Gly Thr Thr Lys Arg Val Thr Gly 
165 170 175 

ttt acc ctg acc ctt gaa gag gcc gta eca ttt gac atg gta get tat 576 
Phe Thr Leu Thr Leu Glu Glu Ala Val Pro Phe Asp Met Val Ala Tyr 
180 185 190 

ggt ega aae ctg atg ctg aag get teg gea ggt tec ttt cea aca att 624 
Gly Arg Asn Leu Met Leu Lys Ala Ser Ala Gly Ser Phe Pro Thr lie 
195 200 205 

gac ttg etc tat gac tac aga teg ttt ttt gac caa tgt tec gat att 

Asp Leu Leu Tyr Asp Tyr Arg Ser Phe Phe Asp Gin Cys Ser Asp lie 

210 215 220 

gga egg ate ggc ttc ttt ccg gaa gat gtt ect aag ceg aaa gtg geg 

Gly Arg lie Gly Phe Phe Pro Glu Asp Val Pro Lys Pro Lys Val Ala 
225 230 235 240 

ate att ggc get ggc att tee gga etc gtg gta gca age gaa ctg ctt 
lie lie Gly Ala Gly lie Ser Gly Leu Val Val Ala Ser Glu Leu Leu 
245 250 255 

cat get ggt gta gac gat gtt aca ata tat gaa gea agt gat egg gtt 
His Ala Gly Val Asp Asp Val Thr lie Tyr Glu Ala Ser Asp Arg Val 
260 265 270 

gga ggc aag ctt tgg tea cat get ttc aag gat get ecc age gtg gtg 
Gly Gly Lys Leu Trp Ser His Ala Phe Lys Asp Ala Pro Ser Val Val 

275 280 285 

gcc gaa atg ggg geg atg ega ttt cct ect get gca teg tgc ttg ttt 
Ala Glu Met Gly Ala Met Arg Phe Pro Pro Ala Ala Ser Cys Leu Phe 

290 295 300 

ttc ttc etc gag egg tac ggc etg tet teg atg agg ccg ttc cea aat 
Phe Phe Leu Glu Arg Tyr Gly Leu Ser Ser Met Arg Pro Phe Pro Asn 
305 310 315 320 

ecc ggc aca gtc gac act aae ttg gte tac eaa gge etc ega tac gtg 
Pro Gly Thr Val Asp Thr Asn Leu Val Tyr Gin Gly Leu Arg Tyr Val 
325 330 335 

tgg aaa gee ggg eag cag eca ccg aag ctg ttc eat cgc gtt tac age 
Trp Lys Ala Gly Gin Gin Pro Pro Lys Leu Phe His Arg Val Tyr Ser 

340 345 350 

ggt tgg cgt geg ttc ttg agg gac ggt ttc eat gag gga gat att gtg 1104 
Gly Trp Arg Ala Phe Leu Arg Asp Gly Phe His Glu Gly Asp lie Val 

355 360 365 

ttg get teg cct gtt gtt att act eaa gee ttg aaa tea gga gac att 1152 
Leu Ala Ser Pro Val Val lie Thr Gin Ala Leu Lys Ser Gly Asp lie 

370 375 380 

agg egg get cat gac tec tgg caa act tgg ctg aae cgt ttc ggg agg 1200 
Arg Arg Ala His Asp Ser Trp Gin Thr Trp Leu Asn Arg Phe Gly Arg 
385 390 395 400 
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1440 



1488 



1536 



gag tec ttc tct tea gcg ata gag agg ate ttt etg ggc acg eat cet 1248 
Glu Ser Phe Ser Ser Ala lie Glu Arg He Phe Leu Gly Tlir His Pro 
405 410 415 

eet ggt ggt gaa aca tgg agt tte eet cat gat tgg gac eta tte aag 1296 
Pro Gly Gly Glu Thr Trp Ser Phe Pro His Asp Trp Asp Leu Phe Lys 
420 425 430 

eta atg gga ata gga tct ggc ggg ttt ggt cea gtt ttt gaa age ggg 1344 
Leu Met Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser Gly 
435 440 445 

ttt att gag ate ctt cgc ttg gtc ata aac gga tat gaa gaa aat eag 1392 
Phe He Glu He Leu Arg Leu Val He Asn Gly Tyr Glu Glu Asn Gin 
450 455 460 

egg atg tgc tct gaa gga ate tea gaa ett cea cgt cga ata gee tct 
Arg Met Cys Ser Glu Gly He Ser Glu Leu Pro Arg Arg He Ala Ser 
465 470 475 480 

caa gtg gtt aac ggt gtg tct gta age eag cgt ata cgc eat gtt caa 
Gin Val val Asn Gly Val Ser Val Ser Gin Arg He Arg His Val Gin 
485 490 495 

gtc agg gcg att gag aag gaa aag aca aaa ata aag ata agg ctt aag 
Val Arg Ala He Glu Lys Glu Lys Thr Lys He Lys He Arg Leu Lys 
500 505 510 

age ggg ata tct gaa ctt tat gat aag gtg gtg gtt aca tct gga etc 1584 
Ser Gly He Ser Glu Leu Tyr Asp Lys Val Val Val Thr Ser Gly Leu 
515 520 525 

gca aat ate caa etc agg cat tgt etg aca tgc gat ace ace att ttt 
Ala Asn He Gin Leu Arg His Cys Leu Thr Cys Asp Thr Thr He Phe 
530 535 540 

cgt gca cea gtg aac caa gcg gtt gat aac age eat atg aca ggc teg 
Arg Ala Pro Val Asn Gin Ala Val Asp Asn Ser His Met Thr Gly Ser 
545 550 555 560 

tea aaa etc ttt etg etg act gaa cga aaa ttt tgg tta gac cat ate 1728 
Ser Lys Leu Phe Leu Leu Thr Glu Arg Lys Phe Trp Leu Asp His He 
565 570 575 

etc ceg tec tgt gtc etc atg gac ggg ate gca aaa gca gtg tac tgc 1776 
Leu Pro Ser Cys Val Leu Met Asp Gly He Ala Lys Ala Val Tyr Cys 
580 585 590 

ttg gac tat gag ceg eag gat ceg aat ggt aaa ggt etg gtg cec cec 1824 
Leu Asp Tyr Glu Pro Gin Asp Pro Asn Gly Lys Gly Leu Val Pro Pro 

595 600 605 

act tat aca tgg gag gac gac tec cac aag etg ttg gcg gtt cec gac 1872 
Thr Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro Asp 

610 615 620 

aaa aaa gag cga tte tgt etg etg egg gac gca att teg aga tct ttc 1920 
Lys Lys Glu Arg Phe Cys Leu Leu Arg Asp Ala He Ser Arg Ser Phe 
625 630 635 640 

ceg gcg ttt gee eag cat eta gtt cct gee tgc get gat tac gac caa 1968 
Pro Ala Phe Ala Gin His Leu Val Pro Ala Cys Ala Asp Tyr Asp Gin 
645 650 655 

aat gtt gtt caa eat gat tgg ett aca gac gag aat gcc ggg gga get 2016 
Asn Val Val Gin His Asp Trp Leu Thr Asp Glu Asn Ala Gly Gly Ala 
660 665 670 
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ttc aaa etc aac egg cgt ggc gag gat ttt tat tct gaa gaa ctt ttc 2064 
Phe Lys Leu Asn Arg Arg Gly Glu Asp Phe Tyr Ser Glu Glu Leu Phe 
675 680 685 

ttt caa gcg ctg gac atg cct aat gat acc gga gtt tac ttg gcg ggt 2112 
Phe Gin Ala Leu Asp Met Pro Asn Asp Thr Gly Val Tyr Leu Ala Gly 
690 695 700 

tgc agt tgt tec ttc acc ggt gga tgg gtg gag ggc get att cag acc 2160 
Cys Ser Cys Ser Phe Thr Gly Gly Trp Val Glu Gly Ala lie Gin Thr 
705 710 715 720 

gcg tgt aac gee gtc tgt gea att ate cac aat tgt gga ggt att ttg 2208 
Ala Cys Asn Ala Val Cys Ala lie lie His Asn Cys Gly Gly lie Leu 
725 730 735 

gca aag gac aat cct etc gaa cac tct tgg aag aga tat aac tac cgc 2256 
Ala Lys Asp Asn Pro Leu Glu His Ser Trp Lys Arg Tyr Asn Tyr Arg 
740 745 750 

aat aga aat taa 2268 
Asn Arg Asn 
755 

<210> 32 
<211> 755 

<212> PRT 

<213> Agrobacterium tumefaciens 
<400> 32 

Met Ser Ala Ser Pro Leu Leu Asp Asn Gin Cys Asp His Phe Ser Thr 
15 10 15 

Lys Met Val Asp Leu lie Met Val Asp Lys Ala Asp Glu Leu Asp Arg 
20 25 30 

Arg Val Ser Asp Ala Phe Ser Glu Arg Glu Ala Ser Arg Gly Arg Arg 
35 40 45 

lie Thr Gin He Ser Gly Glu Cys Ser Ala Gly Leu Ala Cys Lys Arg 
50 55 60 

Leu Ala Asp Gly Arg Phe Pro Glu He Ser Thr Gly Glu Lys Val Ala 
65 70 75 80 

Ala Leu Ser Ala Tyr He Tyr Val Gly Lys Glu He Leu Gly Arg He 
85 90 95 

Leu Glu Ser Glu Pro Trp Ala Arg Ala Arg Val Ser Gly Leu Val Ala 
100 105 110 

He Asp Leu Ala Pro Phe Cys Met Asp Phe Ser Glu Ala Gin Leu Leu 
115 120 125 

Gin Thr Leu Phe Leu Leu Ser Gly Lys Arg Cys Ala Ser Ser Asp Leu 
130 135 140 

Ser His Phe Val Ala He Ser He Ser Lys Thr Ala Arg Ser Arg Thr 
145 150 155 160 

Leu Gin Met Pro Pro Tyr Glu Lys Gly Thr Thr Lys Arg Val Thr Gly 
165 170 175 

Phe Thr Leu Thr Leu Glu Glu Ala Val Pro Phe Asp Met Val Ala Tyr 
180 185 190 

Gly Arg Asn Leu Met Leu Lys Ala Ser Ala Gly Ser Phe Pro Thr He 
195 200 205 
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Asp Leu Leu Tyr Asp Tyx Arg Ser Phe Plie Asp Gin Cys Ser Asp He 
210 215 220 

Gly Arg He Gly Phe Phe Pro Glu Asp Val Pro Lys Pro Lys Val Ala 
225 230 235 240 

lie He Gly Ala Gly He Ser Gly Leu Val Val Ala Ser Glu Leu Leu 
245 250 255 

His Ala Gly Val Asp Asp Val Thr He Tyr Glu Ala Ser Asp Arg Val 
260 265 270 

Gly Gly Lys Leu Trp Ser His Ala Phe Lys Asp Ala Pro Ser Val Val 

275 280 285 

Ala Glu Met Gly Ala Met Arg Phe Pro Pro Ala Ala Ser Cys Leu Phe 
290 295 300 

Phe Phe Leu Glu Arg Tyr Gly Leu Ser Ser Met Arg Pro Phe Pro Asn 

305 310 315 320 

Pro Gly Thr Val Asp Thr Asn Leu Val Tyr Gin Gly Leu Arg Tyr Val 
325 330 335 

Trp Lys Ala Gly Gin Gin Pro Pro Lys Leu Phe His Arg Val Tyr Ser 
340 345 350 

Gly Trp Arg Ala Phe Leu Arg Asp Gly Phe His Glu Gly Asp He Val 
355 360 365 

Leu Ala Ser Pro Val Val He Thr Gin Ala Leu Lys Ser Gly Asp He 
370 375 380 

Arg Arg Ala His Asp Ser Trp Gin Thr Trp Leu Asn Arg Phe Gly Arg 
385 390 395 400 

Glu Ser Phe Ser Ser Ala He Glu Arg He Phe Leu Gly Thr His Pro 
405 410 415 

Pro Gly Gly Glu Thr Trp Ser Phe Pro His Asp Trp Asp Leu Phe Lys 
420 425 430 

Leu Met Gly He Gly Ser Gly Gly Phe Gly Pro Val Phe Glu Ser Gly 
435 440 445 

Phe He Glu He Leu Arg Leu Val He Asn Gly Tyr Glu Glu Asn Gin 
450 455 460 

i\rg Met Cys Ser Glu Gly He Ser Glu Leu Pro Arg Arg He Ala Ser 
465 470 475 480 

Gin Val Val Asn Gly Val Ser Val Ser Gin Arg He Arg His Val Gin 
485 490 495 

Val Arg Ala He Glu Lys Glu Lys Thr Lys He Lys He Arg Leu Lys 
500 505 510 

Ser Gly He Ser Glu Leu Tyr Asp Lys Val Val Val Thr Ser Gly Leu 

515 520 525 

Ala Asn He Gin Leu Arg His Cys Leu Thr Cys Asp Thr Thr He Phe 
530 535 540 

Arg Ala Pro Val Asn Gin Ala Val Asp Asn Ser His Met Thr Gly Ser 
545 550 555 560 

Ser Lys Leu Phe Leu Leu Thr Glu Arg Lys Phe Trp Leu Asp His He 
565 570 575 

Leu Pro Ser Cys Val Leu Met Asp Gly He Ala Lys Ala Val Tyr Cys 
580 585 590 
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Leu Asp Tyr Glu Pro Gin Asp Pro Asn Gly Lys Gly Leu Val Pro Pro 

595 600 605 

Thr Tyr Thr Trp Glu Asp Asp Ser His Lys Leu Leu Ala Val Pro Asp 
610 615 620 

Lys Lys Glu Arg Plie Cys Leu Leu Arg Asp Ala lie Ser Arg Ser Phe 
625 630 635 640 

Pro Ala Phe Ala Gin His Leu Val Pro Ala Cys Ala Asp Tyr Asp Gin 
645 650 655 

Asn Val Val Gin His Asp Trp Leu Thr Asp Glu Asn Ala Gly Gly Ala 
660 665 670 

Phe Lys Leu Asn Arg Arg Gly Glu Asp Phe Tyr Ser Glu Glu Leu Phe 
675 680 685 

Phe Gin Ala Leu Asp Met Pro Asn Asp Thr Gly Val Tyr Leu Ala Gly 
690 695 700 

Cys Ser Cys Ser Phe Thr Gly Gly Trp Val Glu Gly Ala lie Gin Thr 
705 710 715 720 

Ala Cys Asn Ala Val Cys Ala lie lie His Asn Cys Gly Gly lie Leu 
725 730 735 

Ala Lys Asp Asn Pro Leu Glu His Ser Trp Lys Arg Tyr Asn Tyr Arg 
740 745 750 

Asn Arg Asn 
755 



<210> 33 
<211> 1404 
<212> DNA 

<213> Agrobacterium tumefaciens 

<220> 

<221> CDS 

<222> (1)..(1401) 

<223> coding for indole acetamide hydrolase 
<400> 33 

atg gtg ccc att acc teg tta gca caa acc eta gaa cgc ctg aga egg 48 
Met Val Pro He Thr Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 
15 10 15 

aaa gac tac tec tgc tta gaa eta gta gaa act ctg ata geg cgt tge 96 
Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 
20 25 30 

caa get gca aaa cea tta aat gee ett ctg get aca gac tgg gat ggc 144 
Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 
35 40 45 

ttg egg ega age gee aaa aaa aat gat cgt cat gga aac gcc gga tta 192 
Leu Arg Arg Ser Ala Lys Lys Asn Asp Arg His Gly Asn Ala Gly Leu 
50 55 60 

ggt ett tgc ggc att cea etc tgt ttt aag geg aac ate geg acc ggc 240 
Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn lie Ala Thr Gly 
65 70 75 80 

gta ttt cct aca age get get act ccg geg ctg ata aac cac ttg cea 288 
Val Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 95 



aag tat etc gac gat ttt gtg gga aca gtt tct ttt tct gac gtt ate 
Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val lie 
305 310 315 320 

aaa gga att cgt age ece gat gta gcg aae att gtc agt gcg caa att 
Lys Gly lie Arg Ser Pro Asp Val Ala Asn lie Val Ser Ala Gin lie 
325 330 335 

gat ggg cat caa att tec aae gat gaa tat gaa etg gcg cgt caa tec 
Asp Gly His Gin lie Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

tte agg cca agg etc cag gee act tat egg aat tac ttc aga etc tat 
Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 
355 360 365 
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aag ata cca tec cge gtc gea gaa aga ctt ttt tea get gga gea etg 336 
Lys lie Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

eeg ggt gcc teg gga aae atg cat gag tta teg ttt gga att acg age 
Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly lie Thr Ser 
115 120 125 

aae aae tat gcc ace ggt gcg gtg egg aae eeg tgg aat cca agt etg 432 
Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 , 

ata cca ggg ggt tea age ggt ggt gtg get get gcg gtg gea age cga 480 
He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

ttg atg tta ggc gge ata gge acg gat ace ggt gea tct gtt cgc eta 528 
Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

eeg gea gcc etg tgt gge gta gta gga ttt cga eeg acg ctt ggt cga 576 
Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Gly Arg 
180 185 190 

tat cca aga gat egg ata ata eeg ttc age ccc ace egg gac ace gcc 624 
Tyr Pro Arg Asp Arg He He Pro Phe Ser Pro Thr Arg Asp Thr Ala 
195 200 205 

gga ate ata gcg cag tgc gta gee gat gtt ata ate etc gac cag gtg 
Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 

210 215 220 

att tec gga egg teg gcg aaa att tea ccc atg eeg etg aag ggg ctt 
He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

egg ate ggc etc ccc act acc tac ttt tac gat gac ctt gat get gat 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu T^p Ala Asp 
245 250 255 

gtg gcc ttc gea get gaa acg acg att cge ttg eta gcc aae aga ggc 
Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 
260 265 270 

gta acc ttt gtt gaa gcc gac ate ccc cac eta gag gaa ttg aae agt 
Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 

275 280 285 

ggg gea agt ttg cca att gcg ctt tac gaa ttt cca cac get eta aaa 912 
Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 
290 295 300 
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cag tta gat gca ate ctt ttc cca act gca ccc tta gcg gcc aaa gcc 1152 
Gin Leu Asp Ala lie Leu Phe Pro Tlir Ala Pro Leu Ala Ala Lys Ala 

370 375 380 

ata ggt cag gag teg tea gtc ate cae aat ggc tea atg atg aac act 
He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Tlir 
385 390 395 400 

tte aag ate tae gtg ega aat gtg gac eea age age aac gca ggc eta 
Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

cct ggg ttg age ett ect gcc tgc ctt aea eet gat ege ttg cct gtt 
Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 

420 425 430 

gga atg gaa att gat gga tta gcg ggg tea gae cae cgt ctg tta gca 1344 
Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 
435 440 445 

ate ggg gca gca tta gaa aaa get ata aat ttt tct tee ttt eee gat 
He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Ser Ser Phe Pro Asp 
450 455 460 

get ttt aat tag 
Ala Phe Asn 
465 

<210> 34 
<211> 467 
<212> PRT 

<213> Agrobacterium tumef aeiens 

<400> 34 ^ ^ 

Met Val Pro He Tlir Ser Leu Ala Gin Thr Leu Glu Arg Leu Arg Arg 

15 10 15 

Lys Asp Tyr Ser Cys Leu Glu Leu Val Glu Thr Leu He Ala Arg Cys 

20 25 30 

Gin Ala Ala Lys Pro Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Gly 

35 40 45 

Leu Arg Arg Ser Ala Lys Lys Asn Asp Arg His Gly Asn Ala Gly Leu 

50 55 60 

Gly Leu Cys Gly He Pro Leu Cys Phe Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

Val Phe Pro Thr Ser Ala Ala Thr Pro Ala Leu He Asn His Leu Pro 

85 90 ^5 

Lys He Pro Ser Arg Val Ala Glu Arg Leu Phe Ser Ala Gly Ala Leu 
100 105 110 

Pro Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 
115 120 125 

Asn Asn Tyr Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 

165 170 175 

Pro Ala Ala Leu Cys Gly Val Val Gly Phe Arg Pro Thr Leu Gly Arg 
180 185 190 
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Tyr Pro Arg Asp Arg He He Pro Phe Ser Pro Thr Arg Asp Thr Ala 

195 200 205 

Gly He He Ala Gin Cys Val Ala Asp Val He He Leu Asp Gin Val 

210 215 220 

He Ser Gly Arg Ser Ala Lys He Ser Pro Met Pro Leu Lys Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Thr Thr He Arg Leu Leu Ala Asn Arg Gly 

260 265 270 

Val Thr Phe Val Glu Ala Asp He Pro His Leu Glu Glu Leu Asn Ser 

275 280 285 

Gly Ala Ser Leu Pro He Ala Leu Tyr Glu Phe Pro His Ala Leu Lys 

290 295 300 

Lys Tyr Leu Asp Asp Phe Val Gly Thr Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Val Ser Ala Gin He 

325 330 335 

Asp Gly His Gin He Ser Asn Asp Glu Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Arg Leu Gin Ala Thr Tyr Arg Asn Tyr Phe Arg Leu Tyr 

355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Ala Ala Lys Ala 

370 375 380 

He Gly Gin Glu Ser Ser Val He His Asn Gly Ser Met Met Asn Thr 
385 390 395 400 

Phe Lys He Tyr Val Arg Asn Val Asp Pro Ser Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Ala Cys Leu Thr Pro Asp Arg Leu Pro Val 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Ser Asp His Arg Leu Leu Ala 

435 440 445 

He Gly Ala Ala Leu Glu Lys Ala He Asn Phe Ser Ser Phe Pro Asp 
450 455 460 

Ala Phe Asn 
465 



<210> 35 
<211> 1419 
<212> DNA 

<213> Agrobacteriiam vitis 

<220> 

<221> CDS 

<222> (1)..(1416) 

<223> coding for indole acetamide hydrolase 
<400> 35 

atg gtg acc eta ggt tea ate aag gaa ace ctg gaa tgt etc agg ctg 
Met Val Thr Leu Gly Ser He Lys Glu Thr Leu Glu Cys Leu Arg Leu 
1 5 10 15 
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aaa aaa tac tec tgt tec gaa ctg get gaa ace ata ata gee cgt tge 9 6 

Lys Lys Tyr Ser Cys Ser Glu Leu Ala Glu Thr He He Ala Arg Cys 

20 25 30 

gaa gcc gcg aaa tot etc aat get ett ctg gcg act gac tgg gat tac 144 

Glu Ala Ala Lys Ser Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Tyr 
35 40 45 

ctg egg cgt aat gcc aag aaa gta gat gaa gat gga age gcc ggc gag 192 
Leu Arg Arg Asn Ala Lys Lys Val Asp Glu Asp Gly Ser Ala Gly Glu 

50 55 60 

ggt ctt gcc ggc ate ceg ctg tgt tct aaa gcg aac att gca aca ggc 240 
Gly Leu Ala Gly He Pro Leu Cys Ser Lys Ala Asn He Ala Thr Gly 
65 70 75 80 

ata ttc cea gca age gcg gcc aeg ceg gcg ctt gat gaa cat tta cct 288 
He Phe Pro Ala Ser Ala Ala Thr Pro Ala Leu Asp Glu His Leu Pro 
85 90 95 

aca aca cea gee ggc gtc cgt aaa ceg ctt eta gac get ggg gca ctg 336 
Thr Thr Pro Ala Gly Val Arg Lys Pro Leu Leu Asp Ala Gly Ala Leu 
100 105 110 

ata ggc get teg gga aac atg eat gag tta teg ttt ggc att ace agt 
He Gly Ala Ser Gly Asn Met His Glu Leu Ser Phe Gly He Thr Ser 

115 120 125 

aac aac cae gcc act ggt gcg gtg aga aac cec tgg aat cec age tta 

Asn Asn His Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

ata cea gga ggc teg age ggc ggc gtg get get get gta gca tea egg 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 

145 150 155 160 

tta atg etc ggc gga att ggc acc gac acg ggg get teg gtc cgc eta 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val TVrg Leu 

165 170 175 

cct gca tec eta tgt ggc gta gtg gga ttc cgc ceg acg ate ggc aga 576 
Pro Ala Ser Leu Cys Gly Val Val Gly Phe Arg Pro Thr He Gly Arg 

180 185 190 

tat cct gga gac ega att gtg ceg gtt age cec acc cgc gat aca gcc 624 
Tyr Pro Gly Asp Arg He Val Pro Val Ser Pro Thr Arg Asp Thr Ala 

195 200 205 

gga att ate gca cag age gtt cct gat gtg ata etc ctt gac caa ate 672 
Gly He He Ala Gin Ser Val Pro Asp Val He Leu Leu Asp Gin He 

210 215 220 

att tge ggg aag etc acg ace cae caa cct gta cec ctg gag gga tta 
He Cys Gly Lys Leu Thr Thr His Gin Pro Val Pro Leu Glu Gly Leu 
225 230 235 240 

cgt ate ggc ttg cea acc act tac ttt tac gat gac ett gat get gat 
Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

gtg gcc ttc gca get gaa aac ctt ate acg ctg ctg gcc age aag ggt 
val Ala Phe Ala Ala Glu Asn Leu He Thr Leu Leu Ala Ser Lys Gly 
260 265 270 

gta acc ttt gtt aag gcc gag att cea gat ctg cag cgt ctg aac ate 
Val Thr Phe Val Lys Ala Glu He Pro Asp Leu Gin Arg Leu Asn He 
275 280 285 
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ggg gtt age ttt cct att gcc ctg tac gag ttt ccg ttc gcc eta caa 912 
Gly Val Ser Plie Pro He Ala Leu Tyr Glu Phe Pro Phe Ala Leu Gin 
290 295 300 

aag tat ate gat gac ttt gtg aag gat gtg tct ttt tct gae gtc ate 960 
Lys Tyr He Asp Asp Phe Val Lys Asp Val Ser Phe Ser Asp Val He 
305 310 315 320 

aaa gga att cgt age eet gat gta gcc aac att gcc aat get caa att 1008 
Lys Gly He Arg Ser Pro Asp Val Ala Asn He Ala Asn Ala Gin He 
325 330 335 

gat gga cat caa att tec aaa get tea tat gaa ctg gcg cga caa tct 1056 
Asp Gly His Gin He Ser Lys Ala Ser Tyr gIu Leu Ala Arg Gin Ser 
340 345 350 

ttc aga cca aag ctg caa gcc gcc tac cat gat tac ttc aag ctg cae 1104 
Phe Arg Pro Lys Leu Gin Ala Ala Tyr His Asp Tyr Phe Lys Leu His 

355 360 365 

cag eta gac gcg ate ctt ttc ccg aca get ccc ctg aca gcc aaa ccg 1152 
Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 
370 375 380 

ate ggc caa gat tta teg gtg atg eac aat ggc gta atg gcc gac acg 1200 
He Gly Gin Asp Leu Ser Val Met His Asn Gly Val Met Ala Asp Thr 
385 390 395 400 

ttt aaa ate ttc gtg cga aat gtg gat ccg ggg age aac gea ggc ctg 1248 
Phe Lys He Phe Val Arg Asn Val Asp Pro Gly Ser Asn Ala Gly Leu 
405 410 415 

cca gga tta age ctt ccc gtt tct ctt act tea aag ggt ttg cct att 1296 
Pro Gly Leu Ser Leu Pro Val Ser Leu Thr Ser Lys Gly Leu Pro He 
420 425 430 

gga atg gaa ate gat gga tta gcg ggc atg gac gae cgt ttg eta gea 1344 
Gly Met Glu He Asp Gly Leu Ala Gly Met Asp Asp Arg Leu Leu Ala 
435 440 445 

ate gga gcg gea eta gag gaa gcg ata get ttt eat aat tta eet gae 1392 
He Gly Ala Ala Leu Glu Glu Ala He Ala Phe His Asn Leu Pro Asp 
450 455 460 

ttc ccg aaa gtc gag aca aac tac tga 1419 
Phe Pro Lys Val Glu Thr Asn Tyr 
465 470 

<210> 36 
<211> 472 
<212> PRT 

<213> Agrobacterium vitis 
<400> 36 

Met Val Thr Leu Gly Ser He Lys Glu Thr Leu Glu Cys Leu Arg Leu 
15 10 15 

Lys Lys Tyr Ser Cys Ser Glu Leu Ala Glu Thr He He Ala Arg Cys 
20 25 30 

Glu Ala Ala Lys Ser Leu Asn Ala Leu Leu Ala Thr Asp Trp Asp Tyr 
35 40 45 

Leu Arg Arg Asn Ala Lys Lys Val Asp Glu Asp Gly Ser Ala Gly Glu 
50 55 60 

Gly Leu Ala Gly He Pro Leu Cys Ser Lys Ala Asn He Ala Thr Gly 
65 70 75 80 
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lie Phe Pro Ala Ser Ala Ala Thr Pro Ala Leu Asp Glu His Leu Pro 
85 90 95 

Thr Thr Pro Ala Gly Val Arg Lys Pro Leu Leu Asp Ala Gly Ala Leu 
100 105 110 

He Gly Ala Ser Gly Asn Met His Glu Leu Ser Plxe Gly He Thr Ser 

115 120 125 

Asn Asn His Ala Thr Gly Ala Val Arg Asn Pro Trp Asn Pro Ser Leu 

130 135 140 

He Pro Gly Gly Ser Ser Gly Gly Val Ala Ala Ala Val Ala Ser Arg 
145 150 155 160 

Leu Met Leu Gly Gly He Gly Thr Asp Thr Gly Ala Ser Val Arg Leu 
165 170 175 

Pro Ala Ser Leu Cys Gly Val Val Gly Phe Arg Pro Thr He Gly Arg 
180 185 190 

Tyr Pro Gly Asp Arg He Val Pro Val Ser Pro Thr Arg Asp Thr Ala 

195 200 205 

Gly He He Ala Gin Ser Val Pro Asp Val He Leu Leu Asp Gin He 

210 215 220 

He Cys Gly Lys Leu Thr Thr His Gin Pro Val Pro Leu Glu Gly Leu 
225 230 235 240 

Arg He Gly Leu Pro Thr Thr Tyr Phe Tyr Asp Asp Leu Asp Ala Asp 
245 250 255 

Val Ala Phe Ala Ala Glu Asn Leu He Thr Leu Leu Ala Ser Lys Gly 

260 265 270 

Val Thr Phe Val Lys Ala Glu He Pro Asp Leu Gin Arg Leu Asn He 

275 280 285 

Gly Val Ser Phe Pro He Ala Leu Tyr Glu Phe Pro Phe Ala Leu Gin 

290 295 300 

Lys Tyr He Asp Asp Phe Val Lys Asp Val Ser Phe Ser Asp Val He 
305 310 315 320 

Lys Gly He Arg Ser Pro Asp Val Ala Asn He Ala Asn Ala Gin He 

325 330 335 

Asp Gly His Gin He Ser Lys Ala Ser Tyr Glu Leu Ala Arg Gin Ser 
340 345 350 

Phe Arg Pro Lys Leu Gin Ala Ala Tyr His Asp Tyr Phe Lys Leu His 

355 360 365 

Gin Leu Asp Ala He Leu Phe Pro Thr Ala Pro Leu Thr Ala Lys Pro 

370 375 380 

He Gly Gin Asp Leu Ser Val Met His Asn Gly Val Met Ala Asp Thr 
385 390 395 400 

Phe Lys He Phe Val Arg Asn Val Asp Pro Gly Ser Asn Ala Gly Leu 
405 410 415 

Pro Gly Leu Ser Leu Pro Val Ser Leu Thr Ser Lys Gly Leu Pro He 
420 425 430 

Gly Met Glu He Asp Gly Leu Ala Gly Met Asp Asp Arg Leu Leu Ala 

435 440 445 

He Gly Ala Ala Leu Glu Glu Ala He Ala phe His Asn Leu Pro Asp 
450 455 460 
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Phe Pro Lys Val Glu Thr Asn Tyr 
465 470 



<210> 37 
<211> 1263 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1) . . (1260) 

<223> coding for 5-itiethylthioribose kinase 
<400> 37 

atg tct ttt gag gag ttt acg ccg tta aac gag aag tct ctt gta gac 
Met Ser Phe Glu Glu Phe Thr Pro Leu Asn Glu Lys Ser Leu Val Asp 
15 10 15 



Gly Leu lie Ala Gly lie Glu Tyr Pro Phe Leu Ala Asp His Met Ser 

130 135 140 

gat tac atg gcg aag act etc ttc ttc act tct etc etc tat cac gat 

Asp Tyr Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp 

145 150 155 160 

ace aca gag cac aga aga gca gta acc gaa ttt tgt ggt aat gtg gag 

Thr Thr Glu His Arg Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu 

165 170 175 

tta tgc cga tta acg gag caa gtt gtg ttt teg gac cca tat aga gtt 
Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val 
180 185 190 

tec aca ttt aat cgt tgg act tea cct tat ctt gat gat gat get aag 
Ser Thr Phe Asn Arg Trp Thr Ser Pro Tyr Leu Asp Asp Asp Ala Lys 
195 200 205 



48 



96 



192 



tac ate aag tea aca cct get etc tct tec aag ate gga gee gac aag 
Tyr lie Lys Ser Thr Pro Ala Leu Ser Ser Lys He Gly Ala Asp Lys 
20 25 30 

tec gat gat gat ttg gtt ate aaa gaa gtt gga gat gge aat etc aat 144 
Ser Asp Asp Asp Leu Val He Lys Glu Val Gly Asp Gly Asn Leu Asn 
35 40 45 

ttc gtt ttc ate gtt gtt gga tec tct ggt tct ctt gtc ate aaa cag 
Phe Val Phe He Val Val Gly Ser Ser Gly Ser Leu Val He Lys Gin 

50 55 60 

get ctt eca tat att egc tgt ate ggt gaa tea tgg cca atg acg aaa 240 
Ala Leu Pro Tyr He Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys 
65 70 75 80 

gaa aga get tat ttt gaa gca aca act ttg aga aag eat gga aat tta 
Glu Arg Ala Tyr Phe Glu Ala Thr Thr Leu Arg Lys His Gly Asn Leu 

85 90 95 

tea cct gat eat gtt cct gaa gtc tac cat ttt gac aga aca atg gcg 
Ser Pro Asp His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala 
100 105 110 

ttg att gga atg aga tac ctt gag cct cct cat ate att etc egc aaa 
Leu He Gly Met Arg Tyr Leu Glu Pro Pro His He He Leu Arg Lys 

115 120 125 

gga etc att get ggg att gag tat cct ttc etc gca gae eae atg tct 432 



288 



336 



384 



480 



528 



576 



624 
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get gtg cgc gaa gac agt gcc ttg aag etc gaa ate gca gag eta aaa 672 
Ala Val Arg Glu Asp Ser Ala Leu Lys Leu Glu lie Ala Glu Leu Lys 

210 215 220 

teg atg ttc tgt gaa aga get eaa get tta ata cat ggt gat ctt eat 720 
Ser Met Plie Cys Glu Arg Ala Gin Ala Leu lie His Gly Asp Leu His 
225 230 235 240 

act ggt tct gtc atg gtt act caa gat tea acg eaa gtt ata gat eca 768 
Thr Gly Ser Val Met Val Thr Gin Asp Ser Thr Gin Val lie Asp Pro 
245 250 255 

gag ttt teg ttc tat gga ccg atg ggt ttc gat att ggc get tat ctt 816 
Glu Ptie Ser Phe Tyr Gly Pro Met Gly Plie Asp lie Gly Ala Tyr Leu 
260 265 270 

ggt aac ttg ata eta get ttc ttt gca caa gat gga cac gcc act cag 864 
Gly Asn Leu lie Leu Ala Phe Plie Ala Gin Asp Gly His Ala Thr Gin 
275 280 285 

gaa aat gat ega aaa gaa tac aag eag tgg ate ttg aga acc att gag 912 
Glu Asn Asp Arg Lys Glu Tyr Lys Gin Trp lie Leu Arg Thr lie Glu 
290 295 300 

eaa act tgg aat ttg ttt aac aaa agg ttc att gcg eta tgg gat caa 960 
Gin Thr Trp Asn Leu Phe Asn Lys Arg Phe lie Ala Leu Trp Asp Gin 
305 310 315 320 

aac aaa gat gga eca ggc gaa gca tac ctt gca gat ate tat aac aat 1008 
Asn Lys Asp Gly Pro Gly Glu Ala Tyr Leu Ala Asp He Tyr Asn Asn 
325 330 335 

acc gag gtt ttg aag ttt gtt eaa gaa aac tac atg agg aat ttg ttg 1056 
Thr Glu Val Leu Lys Phe Val Gin Glu Asn Tyr Met Arg Asn Leu Leu 
340 345 350 

cat gac tea etc gga ttc ggc get gca aag atg att agg aga att gtg 1104 
His Asp Ser Leu Gly Phe Gly Ala Ala Lys Met He Arg Arg He Val 
355 360 365 

gga gtg gca cat gtt gag gac ttt gaa tea ate gaa gaa gat aag ega 1152 
Gly Val Ala His Val Glu Asp Phe Glu Ser He Glu Glu Asp Lys Arg 
370 375 380 

aga get att tge gag aga agt gca etc gag ttt gcg aag atg ctt etc 
Arg Ala He Cys Glu Arg Ser Ala Leu Glu Phe Ala Lys Met Leu Leu 
385 390 395 400 



1200 



aag gaa agg aga aag ttt aag agt ate ggt gaa gtt gtt tea gca att 1248 
Lys Glu Arg Arg Lys Phe Lys Ser He Gly Glu Val Val Ser Ala He 
405 410 415 

caa caa caa age taa 1263 
Gin Gin Gin Ser 
420 

<210> 38 
<211> 420 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 38 

Met Ser Phe Glu Glu Phe Thr Pro Leu Asn Glu Lys Ser Leu Val Asp 
15 10 15 

Tyr He Lys Ser Thr Pro Ala Leu Ser Ser Lys He Gly Ala Asp Lys 
20 25 30 
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Ser Asp Asp Asp Leu Val lie Lys Glu Val Gly Asp Gly Asn Leu Asn 

35 40 45 

Phe Val Phe He Val Val Gly Ser Ser Gly Ser Leu Val He Lys Gin 

50 55 60 

Ala Leu Pro Tyr He Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys 
65 70 75 80 

Glu Arg Ala Tyr Phe Glu Ala Thr Thr Leu Arg Lys His Gly Asn Leu 

85 90 ^5 

Ser Pro Asp His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala 

100 105 110 

Leu He Gly Met Arg Tyr Leu Glu Pro Pro His He He Leu Arg Lys 

115 120 125 

Gly Leu He Ala Gly He Glu Tyr Pro Phe Leu Ala Asp His Met Ser 

130 135 140 

Asp Tyr Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp 
145 150 155 160 

Thr Thr Glu His Arg Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu 
165 170 175 

Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val 
180 185 190 

Ser Thr Phe Asn Arg Trp Thr Ser Pro Tyr Leu Asp Asp Asp Ala Lys 
195 200 205 

Ala Val Arg Glu Asp Ser Ala Leu Lys Leu Glu He Ala Glu Leu Lys 

210 215 220 

Ser Met Phe Cys Glu Arg Ala Gin Ala Leu He His Gly Asp Leu His 
225 230 235 240 

Thr Gly Ser Val Met Val Thr Gin Asp Ser Thr Gin Val He Asp Pro 
245 250 255 

Glu Phe Ser Phe Tyr Gly Pro Met Gly Phe Asp He Gly Ala Tyr Leu 
260 265 270 

Gly Asn Leu He Leu Ala Phe Phe Ala Gin Asp Gly His Ala Thr Gin 
275 280 285 

Glu Asn Asp Arg Lys Glu Tyr Lys Gin Trp He Leu Arg Thr He Glu 

290 295 300 

Gin Thx Trp Asn Leu Phe Asn Lys Arg Phe He Ala Leu Trp Asp Gin 
305 310 315 320 

Asn Lys Asp Gly Pro Gly Glu Ala Tyr Leu Ala Asp He Tyr Asn Asn 
325 330 335 

Thr Glu Val Leu Lys Phe Val Gin Glu Asn Tyr Met Arg Asn Leu Leu 

340 345 350 

His T^p Ser Leu Gly Phe Gly Ala Ala Lys Met He Arg Arg He Val 
355 360 365 

Gly Val Ala His Val Glu Asp Phe Glu Ser He Glu Glu Asp Lys Arg 

370 375 380 

Arg Ala He Cys Glu Arg Ser Ala Leu Glu Phe Ala Lys Met Leu Leu 
385 390 395 400 

Lys Glu Arg Arg Lys Phe Lys Ser He Gly Glu Val Val Ser Ala He 
405 410 415 
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Gin Gin Gin Ser 
420 

<210> 39 
<211> 1200 
<212> DNA 

<213> Klebsiella pneiunoniae 

<220> 

<221> CDS 

<222> (1) • . (1197) 

<223> coding for 5 -methyl thioribose kinase 
<400> 39 

atg teg caa tac cat acc ttc acc gcc cac gat gcc gtg get tac gcg 



48 



240 



288 



Wh-W-W 1^^^ — =» -» . 

Met Ser Gin Tyr His Thr Phe Tlir Ala His Asp Ala Val Ala Tyr Ala 
15 10 15 

caa cag ttc gcc ggc ate gac aac cca tct gag ctg gtc age gcg cag 96 
Gin Gin Phe Ala Gly lie Asp Asn Pro Ser Glu Leu Val Ser Ala Gin 
20 25 30 

gaa gtg ggc gat ggc aac etc aat ctg gtg ttt aaa gtg ttc gat cgt 144 
Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg 
35 40 45 

cag ggc gtc age egg gcg ate gtc aaa cag gee ctg cec tac gtg cgc 192 
Gin Gly Val Ser Arg Ala lie Val Lys Gin Ala Leu Pro Tyr Val Arg 
50 55 60 

tgc gtc ggc gaa tec tgg ccg ctg acc etc gac cgc gcc cgt etc gaa 
Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg Leu Glu 
65 70 75 80 

gcg cag acc ctg gtc gcc cac tat cag cac age ccg cag cac aeg gta 
Ala Gin Thr Leu Val Ala His Tyr Gin His Ser Pro Gin His Thr Val 
85 90 95 

aaa ate cat cac ttt gat cec gag ctg gcg gtg atg gtg atg gaa gat 336 
Lys lie His His Phe Asp Pro Glu Leu Ala Val Met Val Met Glu Asp 
100 105 110 

ett tec gac cac cgc ate tgg cgc gga gag ctt ate get aac gtc tac 384 
Leu Ser Asp His Arg lie Trp Arg Gly Glu Leu He Ala Asn Val Tyr 

115 120 125 

tat cec cag gcg gcc cgc cag ctt ggc gac tat ctg gcg cag gtg ttg 432 
Tyr Pro Gin Ala Ala Arg Gin Leu Gly Asp Tyr Leu Ala Gin Val Leu 
130 135 140 

ttc cac acc age gat ttc tac etc cat cec cac gag aaa aag gcg cag 480 
Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gin 
145 150 155 160 

gtg gcg cag ttt att aac ccg gcg atg tgc gag ate ace gag gat ctg 528 
Val Ala Gin Phe He Asn Pro Ala Met Cys Glu lie Thr Glu Asp Leu 
165 170 175 

ttc ttt aac gac ccg tat cag ate cac gag cgc aat aac tac ccg gcg 576 
Phe Phe Asn Asp Pro Tyr Gin He His Glu Arg Asn Asn Tyr Pro Ala 
180 185 190 

gag ctg gag gcc gat gtc gcc gcc ctg cgc gac gac gcc cag ctt aag 624 
Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gin Leu Lys 
195 200 205 
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ctg gcg gtg gcg gcg ctg aag cac cgt ttc ttt gcc cat gcg gaa gcg 672 
Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala 
210 215 220 

ctg ctg cac ggc gat ate cac age ggg teg ate ttc gtt gcc gaa ggt 720 
Leu Leu His Gly Asp lie His Ser Gly Ser lie Phe Val Ala Glu Gly 
225 230 235 240 

age ctg aag gcc ate gac gcc gag ttc ggc tac ttc ggc cec ate ggc 768 
Ser Leu Lys Ala lie Asp Ala Glu Phe Gly Tyr Phe Gly Pro lie Gly 

245 250 255 

ttc gat ate ggc ace gee ate ggc aac ctg ctg ctg aac tac tgc ggc 816 
Phe Asp He Gly Thr Ala He Gly Asn Leu Leu Leu Asn Tyr Cys Gly 
260 265 270 

ctg ccg ggc cag etc ggc att cgc gat gcc gcc gcc gcg cgc gag cag 864 
Leu Pro Gly Gin Leu Gly He Arg Asp Ala Ala Ala Ala Arg Glu Gin 
275 280 285 

egg ctg aac gac ate cac cag ctg tgg ace ace ttc gee gag cgc ttc 912 
Arg Leu Asn Asp He His Gin Leu Trp Thr Thr Phe Ala Glu Arg Phe 
290 295 300 

cag gcg ctg gcg gcg gag aaa ace cgc gac gcg gcg ctg get tac ccc 960 
Gin Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro 
305 310 315 320 

ggc tac gcc tec gee ttt ctg aag aaa gtc tgg gcg gac gcg gte ggc 1008 
Gly Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly 
325 330 335 

ttc tgc ggc age gaa ctg ate cgc cgc age gtc gga ctg teg cac gtc 1056 
Phe Cys Gly Ser Glu Leu He Arg Arg Ser Val Gly Leu Ser His Val 
340 345 350 

gcg gat ate gac act ate cag gac gac gcc atg cgt cat gag tgc ctg 1104 
Ala Asp He Asp Thr He Gin Asp Asp Ala Met Arg His Glu Cys Leu 
355 360 365 

cgc cac gcc att ace ctg ggc aga gcg ctg ate gtg ctg gee gag cgt 1152 
Arg His Ala He Thr Leu Gly Arg Ala Leu He Val Leu Ala Glu Arg 
370 375 380 

ate gac age gtc gac gag ctg ctg gcg egg gta cgc cag tac age tga 1200 
He Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gin Tyr Ser 
385 390 395 

<210> 40 
<211> 399 
<212> PRT 

<213> Klebsiella pneumoniae 
<400> 40 

Met Ser Gin Tyr His Thr Phe Thr Ala His Asp Ala Val Ala Tyr Ala 

15 10 15 

Gin Gin Phe Ala Gly He Asp Asn Pro Ser Glu Leu Val Ser Ala Gin 
20 25 30 

Glu Val Gly Asp Gly Asn Leu Asn Leu Val Phe Lys Val Phe Asp Arg 
35 40 45 

Gin Gly Val Ser Arg Ala He Val Lys Gin Ala Leu Pro Tyr Val Arg 
50 55 60 

Cys Val Gly Glu Ser Trp Pro Leu Thr Leu Asp Arg Ala Arg Leu Glu 
65 70 75 80 
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Ala Gin Thr Leu Val Ala His Tyr Gin His Ser Pro Gin His Tlir Val 
85 90 95 

Lys lie His His Plie Asp Pro Glu Leu Ala Val Met Val Met Glu Asp 

100 105 110 

Leu Ser Asp His Arg lie Trp Arg Gly Glu Leu lie Ala Asn Val Tyr 

115 120 125 

Tyr Pro Gin Ala Ala Arg Gin Leu Gly Asp Tyr Leu Ala Gin Val Leu 

130 135 140 

Phe His Thr Ser Asp Phe Tyr Leu His Pro His Glu Lys Lys Ala Gin 
145 150 155 160 

Val Ala Gin Phe lie Asn Pro Ala Met Cys Glu He Thr Glu Asp Leu 
165 170 175 

Phe Phe Asn Asp Pro Tyr Gin He His Glu Arg Asn Asn Tyr Pro Ala 
180 185 190 

Glu Leu Glu Ala Asp Val Ala Ala Leu Arg Asp Asp Ala Gin Leu Lys 

195 200 205 

Leu Ala Val Ala Ala Leu Lys His Arg Phe Phe Ala His Ala Glu Ala 

210 215 220 

Leu Leu His Gly Asp He His Ser Gly Ser He Phe Val Ala Glu Gly 
225 230 235 240 

Ser Leu Lys Ala He Asp Ala Glu Phe Gly Tyr Phe Gly Pro He Gly 
245 250 255 

Phe Asp He Gly Thr Ala He Gly Asn Leu Leu Leu Asn Tyr Cys Gly 

260 265 270 

Leu Pro Gly Gin Leu Gly He Arg Asp Ala Ala Ala Ala Arg Glu Gin 

275 280 285 

Arg Leu Asn Asp He His Gin Leu Trp Thr Thr Phe Ala Glu Arg Phe 

290 295 300 

Gin Ala Leu Ala Ala Glu Lys Thr Arg Asp Ala Ala Leu Ala Tyr Pro 
305 310 315 320 

Glv Tyr Ala Ser Ala Phe Leu Lys Lys Val Trp Ala Asp Ala Val Gly 
325 330 335 

Phe Cys Gly Ser Glu Leu He Arg Arg Ser Val Gly Leu Ser His Val 

340 345 350 

Ala Asp He Asp Thr He Gin Asp Asp Ala Met Arg His Glu Cys Leu 

355 ■ 360 365 

Arg His Ala He Thr Leu Gly Arg Ala Leu He Val Leu Ala Glu Arg 

370 375 380 

He Asp Ser Val Asp Glu Leu Leu Ala Arg Val Arg Gin Tyr Ser 
385 390 395 



<210> 41 
<211> 1140 
<212> DNA 

<213> Arabidopsis thaliana 

<220> 

<221> CDS 

<222> (1)..(1137) 

<223> coding for alcohol dehydrogenase 
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48 



288 



<400> 41 

atg tct acc acc gga cag att att cga tgc aaa get get gtg gca tgg 
Met Ser Thr Thr Gly Gin lie He Arg Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gaa gcc gga aag cca ctg gtg ate gag gaa gtg gag gtt get cca ccg 96 
Glu Ala Gly Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag aaa cac gaa gtt cgt ate aag att cte ttc act tct etc tgt cac 144 
Gin Lys His Glu Val Arg He Lys He Leu Phe Thr Ser Leu Cys His 

35 40 45 

ace gat gtt tac ttc tgg gaa get aag gga eaa aca ccg ttg ttt cca 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Leu Phe Pro 

50 55 60 

egt ate ttc ggc eat gaa get gga ggg att gtt gag agt gtt gga gaa 240 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

gga gtg act gat ett cag cca gga gat eat gtg ttg ccg ate ttt ace 
Gly Val Thr Asp Leu Gin Pro Gly Asp His Val Leu Pro He Phe Thr 

85 90 95 

gga gaa tgt gga gat tgt egt eat tgc cag teg gag gaa tea aac atg 336 
Gly Glu Cys Gly Asp Cys Arg His Cys Gin Ser Glu Glu Ser Asn Met 
100 105 110 

tgt gat ctt etc agg ate aac aca gag cga gga ggt atg att cac gat 384 
Cys Asp Leu Leu Arg He Asn Thr Glu Arg Gly Gly Met He His Asp 

115 120 125 

ggt gaa tct aga ttc tee att aat ggc aaa cca ate tac cat ttc ctt 432 
Gly Glu Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Leu 

130 135 140 

ggg acg tec aeg ttc agt gag tac act gtg gtt cac tct ggt cag gtc 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Val His Ser Gly Gin Val 
145 150 155 160 

get aag ate aat ccg gat get cct ctt gac aag gtc tgt att gtc agt 528 
Ala Lys He Asn Pro Asp Ala Pro Leu Asp Lys Val Cys He Val Ser 
165 170 175 

tgt ggt ttg tct act ggg tta gga gca act ttg aat gtg get aaa eec 576 
Cys Gly Leu Ser Thr Gly Leu Gly Ala Thr Leu Asn Val Ala Lys Pro 
180 185 190 

aag aaa ggt caa agt gtt gcc att ttt ggt ctt ggt get gtt ggt tta 624 
Lys Lys Gly Gin Ser Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

ggc get gca gaa ggt get aga ate get ggt get tet agg ate ate ggt 672 

Gly Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 

210 215 220 

gtt gat ttt aac tct aaa aga ttc gac caa get aag gaa ttc ggt gtg 720 

Val Asp Phe Asn Ser Lys Arg Phe Asp Gin Ala Lys Glu Phe Gly Val 

225 230 235 240 

acc gag tgt gtg aac ccg aaa gac cat gac aag cca att caa cag gtg 768 
Thr Glu Cys Val Asn Pro Lys Asp His Asp Lys Pro He Gin Gin Val 
245 250 255 

ate get gag atg acg gat ggt ggg gtg gac agg agt gtg gaa tgc acc 816 
He Ala Glu Met Thr Asp Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 
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gga 
Gly 


age 
Ser 


gtt 
Val 
275 


cag 
Gin 


gcc 
Ala 


atg 
Met 


att 
He 


caa 
Gin 
280 


gca 
Ala 


ttt 
Phe 


gaa 
Glu 


tgt 
Cys 


gtc 
Val 
285 


cac 
His 


gat gge 
Asp Gly 


O O** 


tgg 
Tarp 


ggt gtt gca 
Gly Val Ala 
290 


gtg 
Val 


ctg 
Leu 


gtg ggt gtg 
Val Gly val 
295 


cca 
Pro 


age 
Ser 


aaa 
Lys 
300 


gac 
Asp 


gat 
Asp 


gee 
Ala 


ttc 
Phe 


Q 1 O 


aag 

LVS 
305 


act 
Thr 


cat 
His 


ccg 
Pro 


atg 
Met 


aat 
Asn 
310 


ttc 
Pile 


ttg aat gag agg act 
Leu Asn Glu Arg Thr 
315 


ctt 
Leu 


aag 
Lys 


ggt act 
Gly Thr 
320 


2? OU 


ttc 
Phe 


ttc 
Phe 


ggg aac tac 
Gly Asn Tyr 
325 


aaa 
Lys 


cec 
Pro 


aaa 
Lys 


act 
Thr 


gac 

Asp 
330 


att 
He 


cec ggg gtt 
Pro Gly Val 


gtg 
Val 
335 


gaa 
Glu 


J.UUO 


aag 
Lvs 


tac 
Tyr 


atg 
Met 


aac 
Asn 
340 


aag 
Lys 


gag 
Glu 


ctg 
Leu 


gag 
Glu 


ett 
Leu 
345 


gag 
Glu 


aaa 
Lys 


ttc 
Phe 


ate 
He 


act 

Thr 
350 


cac 
His 


aca 
Thr 


±UDO 


crtcT 
Val 


cca 
Pro 


ttc 
Plie 
355 


teg 
Ser 


gaa 
Glu 


ate 
He 


aac 
Asn 


aag 
Lys 
360 


gee 
Ala 


ttt 
Phe 


gat 
Asp 


tac 
Tyr 


atg 

Met 
365 


ctg 
Leu 


aag 
Lys 


gga 
Gly 


1104 


gag 
Glu 


agt 
Ser 


att 
He 


cgt 
Arg 


tgc 
Cys 


ate 
He 


ate 
He 


ace 
Thr 


atg 
Met 


ggt get 
Gly Ala 


tga 










1140 



370 375 

<210> 42 
<211> 379 
<212> PRT 

<213> Arabidopsis thaliana 
<400> 42 

Met Ser Thr Thr Gly Gin He He Arg Cys Lys Ala Ala Val Ala Tzp 
15 10 15 

Glu Ala Gly Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 

20 25 30 

Gin Lys His Glu Val Arg He Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Leu Phe Pro 

50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly val Thr Asp Leu Gin Pro Gly Asp His Val Leu Pro He Phe Thr 

85 90 95 

Gly Glu Cys Gly Asp Cys Arg His Cys Gin Ser Glu Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg He Asn Thr Glu Arg Gly Gly Met He His Asp 

115 120 125 

Gly Glu Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Leu 

130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Val His Ser Gly Gin Val 
145 150 155 160 

Ala Lys He Asn Pro Asp Ala Pro Leu Asp Lys Val Cys He Val Ser 
165 170 175 

Cys Gly Leu Ser Thr Gly Leu Gly Ala Thr Leu Asn Val Ala Lys Pro 
180 185 190 
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Lys Lys Gly Gin Ser Val Ala lie Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Gly Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

Val Asp Phe Asn Ser Lys Arg Phe Asp Gin Ala Lys Glu Phe Gly Val 

225 230 235 240 

Thr Glu Cys Val Asn Pro Lys Asp His Asp Lys Pro He Gin Gin Val 
245 250 255 

He Ala Glu Met Thr Asp Gly Gly Val Asp Arg Ser Val Glu Cys Thr 

260 265 270 

Gly Ser Val Gin Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro Ser Lys Asp Asp Ala Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Lys Thr Asp He Pro Gly Val Val Glu 

325 330 335 

Lys Tyr Met Asn Lys Glu Leu Glu Leu Glu Lys Phe He Thr His Thr 
340 345 350 

Val Pro Phe Ser Glu He Asn Lys Ala Phe Asp Tyr Met Leu Lys Gly 
355 360 365 

Glu Ser He Arg Cys He He Thr Met Gly Ala 
370 375 



<210> 43 
<211> 1140 
<212> DNA 

<213> Hordeum vulgar e 

<220> 

<221> CDS 

<222> (1)..(1137) 

<223> coding for alcohol dehydrogenase 
<400> 43 

atg gcg acg gcc ggc aag gtg ate aag tgc aaa gcc gcg gtg gcg tgg 48 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gag gcc ggg aag ccg ctg acc atg gag gag gtg gag gtg gcg ccg ccg 96 
Glu Ala Gly Lys Pro Leu Thr Met Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gcc atg gag gtg cgc gtc aag ate etc tte acc tec etc tgc cac 144 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gcc aag ggg cag acc ccc atg ttc cct 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Met Phe Pro 
50 55 60 

egg ate ttc ggc cat gaa get gga ggc ata gtg gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 
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432 



480 



528 



ggc gtg act gat gtt gcc cct ggt gac cac gtc etc cct gtg ttc act 288 
Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 
85 90 95 

ggg gag tgt aag gaa tgc cca cat tgc aag tct gcg gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Pro His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ctg etc agg ate aac acc gac aga ggt gtg atg ate ggg gat 384 

Cys Asp Leu Leu Arg lie Asn Thr Asp Arg Gly Val Met He Gly Asp 

115 120 125 

ggc aag teg cgc ttc tct att ggc ggc aag ccg att tac cat ttc gta 

Gly Lys Ser Arg Phe Ser He Gly Gly Lys Pro He Tyr His Phe Val 

130 135 140 

ggg act tec acc ttc agt gag tac act gtc atg eat gtc ggt tgt gtt 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 

145 150 155 160 

gcc aag ate aac cct gag get ecc ctt gat aaa gtc tgt gtt ctt age 
Ala Lys He Asn Pro Glu Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

tgt ggt att tgc act ggt ctt ggc gcg tea att aat gtt gca aaa cca 576 
Cys Gly He Cys Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

cca aag ggt tec aca gtg gcg ata ttt ggg eta gga get gtt ggc ctt 
Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

get get gca gaa ggt gca agg att gca ggt gca tea agg ate att ggt 
Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

gtt gac ctg aac gee age aga ttt gaa gag get agg aag ttt ggc tgc 
Val Asp Leu Asn Ala Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

acg gaa ttt gtg aac ccg aaa gat cac acc aag cca gtt cag cag gtg 
Thr Glu Phe Val Asn Pro Lys Asp His Thr Lys Pro Val Gin Gin Val 
245 250 255 

etc get gac atg aca aat ggc gga gtt gac cgc agt gtt gag tgc act 
Leu Ala Asp Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac gtc aat get atg ata caa gca ttt gaa tgt gtt cat gat ggc 
Gly Asn Val Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 

275 280 285 

tgg ggt gta get gtg ctg gtg ggt gtg cca cac aag gac get gaa ttc 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 

290 295 300 

aag ace cac ccg atg aac ttc ctg aat gag agg acc ctg aag ggc acc 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

ttc ttc ggt aac ttc aag ccg cgc act gac ctg ecc aat gtc gtg gag 
Phe Phe Gly Asn Phe Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

atg tac atg aag aag gag ctg gag gtg gag aag ttc ate aca cac age 
Met Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 
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gtg ccg ttc teg gag ata aac aag gcc ttc gac ctt atg gcg aag ggg 1104 
Val Pro Phe Ser Glu lie Asn Lys Ala Phe Asp Leu Met Ala Lys Gly 
355 360 365 

gag ggc ate cgt tgc ate ate ege atg gae aac tag 1140 
Glu Gly lie Arg Cys lie lie Arg Met Asp Asn 
370 375 

<210> 44 
<211> 379 
<212> PRT 

<213> Hordeum vulgare 

<400> 44 

Met Ala Thr Ala Gly Lys Val lie Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

Glu Ala Gly Lys Pro Leu "rhr Met Glu Glu Val Glu Val Ala Pro Pro 

20 25 30 

Gin Ala Met Glu Val Arg Val Lys lie Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Met Phe Pro 
50 55 60 

Arg lie Phe Gly His Glu Ala Gly Gly lie Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 
85 90 95 

Gly Glu Cys Lys Glu Cys Pro His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg lie Asn Thr Asp Arg Gly Val Met lie Gly Asp 
115 120 125 

Gly Lys Ser Arg Phe Ser lie Gly Gly Lys Pro He Tyr His Phe Val 
130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys He Asn Pro Glu Ala Pro Leu Asp Lys Val Cys Val Leu Ser 

165 170 175 

Cys Gly He Cys Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 

195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

Val Asp Leu Asn Ala Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Thr Lys Pro Val Gin Gin Val 
245 250 255 

Leu Ala Asp Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn Val Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 
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Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Phe Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Met Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe lie Thr His Ser 

340 345 350 

Val Pro Phe Ser Glu He Asn Lys Ala Phe Asp Leu Met Ala Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Asp Asn 
370 375 



<210> 45 
<211> 1140 
<212> DNA 

<213> Oryza sativa 

<220> 

<221> CDS 

<222> (1) . , (1137) 

<223> coding for alcohol dehydrogenase 
<400> 45 

atg gcg acc gca ggg aag gtg ate aag tgc aaa gcg gcg gtg gca tgg 48 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 

15 10 15 

gag gcc gcg aag ccg ctg gtg ate gag gag gtg gag gtg gcg ccg ccg 96 
Glu Ala Ala Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gcc atg gag gtg cgc gtc aag ate etc ttc acc teg etc tgc cae 144 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gcc aag gga cag act ccc gtg ttc cet 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

egg ate ttc ggc cat gaa get gga ggt att gtg gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

ggt gtg act gat ctt gcc cct ggt gac cat gtt etc cet gtg ttc act 288 
Gly Val Thr Asp Leu Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 
85 90 95 

ggg gag tgc aag gag tgt gee cac tgc aag tea gca gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ctg etc agg ate aac act gac agg ggt gtg atg att ggt gat 384 
Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

ggc aaa tea cgc ttt tee ate aac ggg aag ccc att tac eat ttc gtc 432 
Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 



ggg act teg acc ttc age gag tac act gtc atg eat gtt ggt tgc gtt 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 
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gcg aag ate aac ccg gca get cea ctt gat aaa gtt tgc gtt ctt age 528 
Ala Lys He Asn Pro Ala Ala Pro I^eu Asp Lys Val Cys Val Leu Ser 
165 170 175 

tgt ggt att tct act ggt ctt ggt get aea ate aat gtg gca aag cea 576 
Cys Gly He Ser Thr Gly Leu Gly Ala Thr He Asn Val Ala Lys Pro 
180 185 190 

cea aag ggt teg acg gtg gcg ata ttt ggt eta gga get gta ggc ctt 624 
Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

get gcc gca gaa ggt gca agg att gca gga gcg tea agg ate att ggc 672 
Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

att gac ctg aac gcc aac aga ttt gaa gaa get agg aaa ttt ggt tgc 720 
He Asp Leu Asn Ala Asn Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

act gaa ttt gtg aac cea aag gac cat gac aag cea gtt eag cag gta 768 
Thr Glu Phe Val Asn Pro Lys Asp His Asp Lys Pro Val Gin Gin Val 
245 250 255 

ctt get gag atg ace aat ggc gga gtt gac ege age gtt gaa tgc act 816 
Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac ate aac gcc atg ate caa gca ttt gaa tgt gtt cat gat ggc 864 
Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gtt get gtt ttg gte ggc gtg cea cac aag gac gee gag tte 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

aag acc cac ccg atg aac tte ctg aac gag agg act etc aag gga acc 960 
Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

tte tte ggc aac tac aag cea ege ace gat ctg cec aac gtc gte gag 1008 
Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

etc tac atg aag aag gag ctg gag gtg gag aag tte ate aea cac age 1056 
Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

gtg ccg tte teg gag ate aac acg gcg tte gac ctg atg cac aag ggc 1104 
val Pro Phe Ser Glu He Asn Thr Ala Phe Asp Leu Met His Lys Gly 
355 360 365 

gag ggc ate cgc tgc ate ate ege atg gag aac tga 1140 
Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 

<210> 46 
<211> 379 
<212> PRT 

<213> Oryza sativa 
<400> 46 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

Glu Ala Ala Lys Pro Leu Val He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 
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Gin Ala Met Glu Val Arg Val Lys lie Leu Phe Thr Ser Leu Cys His 

35 40 45 

Thr Asp Val Tyr Piie Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He Val Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Leu Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 

85 90 95 

Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 

130 135 140 

Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys He Asn Pro Ala Ala Pro Leu Asp Lys Val Cys Val Leu Ser 

165 170 175 

Cys Gly He Ser Thr Gly Leu Gly Ala Thr He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala He Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

He Asp Leu Asn Ala Asn Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Asp Lys Pro Val Gin Gin Val 
245 250 255 

Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 

260 265 270 

Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

Val Pro Phe Ser Glu He Asn Thr Ala Phe Asp Leu Met His Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 



<210> 47 
<211> 1140 
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<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1) . . (1137) 

<223> coding for alcohol dehydrogenase 
<400> 47 

atg gcg acc gcg ggg aag gtg ate aag tgc aaa get gcg gtg gca tgg 48 
Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 
15 10 15 

gag gcc ggc aag cca ctg teg ate gag gag gtg gag gta gcg cet ccg 96 
Glu Ala Gly Lys Pro Leu Ser He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

cag gcc atg gag gtg cgc gtc aag ate etc ttc ace teg etc tgc cac 14'4 
Gin Ala Met Glu Val Arg Val Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

acc gac gtc tac ttc tgg gag gcc aag ggg cag act ecc gtg ttc cet 192 
Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

egg ate ttt ggc cat gag get gga ggt ate at a gag agt gtt gga gag 240 
Arg He Phe Gly His Glu Ala Gly Gly He He Glu Ser Val Gly Glu 
65 70 75 80 

ggt gtg act gac gta get ccg ggc gac cat gtc ett cet gtg ttc act 288 
Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 
85 90 95 

ggg gag tgc aag gag tgc gcc cac tgc aag teg gca gag age aac atg 336 
Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

tgt gat ttg etc agg ate aac act gac cgc ggt gtg atg att ggc gat 384 
Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

ggc aag teg egg ttt tea ate aat ggg aag cet ate tac cac ttt gtt 432 
Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 

ggg act tee ace ttc age gag tac ace gtc atg cat gtc ggt tgt gtt 480 
Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

gca aag ate aac cet cag get eee ett gat aaa gtt tgc gtc ett age 528 
Ala Lys He Asn Pro Gin Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

tgt ggt att tet act ggt ett ggt gca tea att aat gtt gca aaa cet 576 
Cys Gly He Ser Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
ISO 185 190 

ccg aag ggt teg aca gtg get gtt ttc ggt tta gga gee gtt ggt ett 624 
Pro Lys Gly Ser Thr Val Ala Val Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

gcc get gca gaa ggt gca agg att get gga gcg tea agg ate att ggt 672 
Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 
210 215 220 

gtc gac ctg aac eee age aga ttc gaa gaa get agg aag ttc ggt tgc 720 
Val Asp Leu Asn Pro Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 
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act gaa ttt gtg aac cca aaa gac cac aac aag ccg gtg cag gag gta 768 
Tlir Glu Ptie Val Asn Pro Lys Asp His Asn Lys Pro Val Gin Glu Val 
245 250 255 

ctt get gag atg acc aac gga ggg gtc gac cgc age gtg gaa tgc act 816 
Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

ggc aac ate aat get atg ate caa get ttc gaa tgt gtt cat gat ggc 864 
Gly Asn lie Asn Ala Met lie Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

tgg ggt gtt gee gtg ctg gtg ggt gtg ccg eat aag gac get gag ttc 912 
Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 
290 295 300 

aag acc cac ccg atg aac ttc ctg aac gaa agg acc ctg aag ggg ace 960 
Lys Tlir His Pro Met Asn Phe Leu Asn Glu Arg 1*hr Leu Lys Gly Thr 
305 310 315 320 

ttc ttt ggc aac tat aag cca cgc act gat ctg cca aat gtg gtg gag 1008 
Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 
325 330 335 

Ctg tac atg aaa aag gag ctg gag gtg gag aag ttc ate acg cac age 1056 
Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe lie Thr His Ser 
340 345 350 

gtc ccg ttc geg gag ate aac aag geg ttc aac ctg atg gee aag ggg 1104 
Val Pro Phe Ala Glu lie Asn Lys Ala Phe Asn Leu Met Ala Lys Gly 
355 360 365 

gag ggc ate cgc tgc ate ate cgc atg gag aac tag 1140 
Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 

<210> 48 
<211> 379 
<212> PRT 
<213> Zea mays 

<400> 48 

Met Ala Thr Ala Gly Lys Val He Lys Cys Lys Ala Ala Val Ala Trp 

15 10 15 

Glu Ala Gly Lys Pro Leu Ser He Glu Glu Val Glu Val Ala Pro Pro 
20 25 30 

Gin Ala Met Glu Val Arg VaJ. Lys He Leu Phe Thr Ser Leu Cys His 
35 40 45 

Thr Asp Val Tyr Phe Trp Glu Ala Lys Gly Gin Thr Pro Val Phe Pro 
50 55 60 

Arg He Phe Gly His Glu Ala Gly Gly He He Glu Ser Val Gly Glu 
65 70 75 80 

Gly Val Thr Asp Val Ala Pro Gly Asp His Val Leu Pro Val Phe Thr 
85 90 95 

Gly Glu Cys Lys Glu Cys Ala His Cys Lys Ser Ala Glu Ser Asn Met 
100 105 110 

Cys Asp Leu Leu Arg He Asn Thr Asp Arg Gly Val Met He Gly Asp 
115 120 125 

Gly Lys Ser Arg Phe Ser He Asn Gly Lys Pro He Tyr His Phe Val 
130 135 140 
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Gly Thr Ser Thr Phe Ser Glu Tyr Thr Val Met His Val Gly Cys Val 
145 150 155 160 

Ala Lys lie Asn Pro Gin Ala Pro Leu Asp Lys Val Cys Val Leu Ser 
165 170 175 

Cys Gly He Ser Thr Gly Leu Gly Ala Ser He Asn Val Ala Lys Pro 
180 185 190 

Pro Lys Gly Ser Thr Val Ala Val Phe Gly Leu Gly Ala Val Gly Leu 
195 200 205 

Ala Ala Ala Glu Gly Ala Arg He Ala Gly Ala Ser Arg He He Gly 

210 215 220 

Val Asp Leu Asn Pro Ser Arg Phe Glu Glu Ala Arg Lys Phe Gly Cys 
225 230 235 240 

Thr Glu Phe Val Asn Pro Lys Asp His Asn Lys Pro Val Gin Glu Val 
245 250 255 

Leu Ala Glu Met Thr Asn Gly Gly Val Asp Arg Ser Val Glu Cys Thr 
260 265 270 

Gly Asn He Asn Ala Met He Gin Ala Phe Glu Cys Val His Asp Gly 
275 280 285 

Trp Gly Val Ala Val Leu Val Gly Val Pro His Lys Asp Ala Glu Phe 

290 295 300 

Lys Thr His Pro Met Asn Phe Leu Asn Glu Arg Thr Leu Lys Gly Thr 
305 310 315 320 

Phe Phe Gly Asn Tyr Lys Pro Arg Thr Asp Leu Pro Asn Val Val Glu 

325 330 335 

Leu Tyr Met Lys Lys Glu Leu Glu Val Glu Lys Phe He Thr His Ser 
340 345 350 

Val Pro Phe Ala Glu He Asn Lys Ala Phe Asn Leu Met Ala Lys Gly 
355 360 365 

Glu Gly He Arg Cys He He Arg Met Glu Asn 
370 375 



<210> 49 
<211> 505 
<212> DNA 

<213> KQnstliche Sequenz 
<220> 

<223> Beschreib\ing der kiinstlichen Sequenz: coding for 
sense RNA-f ragment of E.coli codA gene 

<400> 49 

aagcttggct aacagtgtcg aataacgctt tacaaacaat tattaacgcc cggttaccag 60 
gcgaagaggg gctgtggcag attcatctgc aggacggaaa aatcagcgcc attgatgcgc 120 
aatccggcgt gatgcccata actgaaaaca gcctggatgc cgaacaaggt ttagttatac 180 
cgccgtttgt ggagccacat attcacctgg acaccacgca aaccgccgga caaccgaact 240 
ggaatcagtc cggcacgctg tttgaaggca ttgaacgctg ggccgagcgc aaagcgttat 300 
taacccatga cgatgtgaaa caacgcgcat ggcaaacgct gaaatggcag attgccaacg 360 
gcattcagca tgtgcgtacc catgtcgatg tttcggatgc aacgctaact gcgctgaaag 420 
caatgctgga agtgaagcag gaagtcgcgc cgtggattga tctgcaaatc gtcgccttcc 480 
ctcaggaagg gattttgtcg tcgac 505 



<210> 50 
<211> 27 
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<212> DNA 

<213> Kunstlichie Sequenz 
<220> 

<223> Beschreibung der ktiiist lichen Sequenz: 
oligonucleotide primer 

<400> 50 

cgtgaatacg gcgtggagtc g 21 

<210> 51 

<211> 26 

<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Besclireibiing der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 51 

cggcaggata atcaggttgg 20 

<210> 52 
<211> 505 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der ktinstlichen Secpienz: coding for 
antisense RNA- fragment of E.coli codA gene 

<400> 52 

gaattcggct aacagtgtcg aataacgctt tacaaacaat tattaacgcc cggttaccag 60 
gcgaagaggg gctgtggcag attcatctgc aggacggaaa aatcagcgcc attgatgcgc 120 
aatccggcgt gatgcccata actgaaaaca gcctggatgc cgaacaaggt ttagttatac 180 
cgccgtttgt ggagccacat attcacctgg acaccacgca aaccgccgga caaccgaact 240 
ggaatcagtc cggcacgctg tttgaaggca ttgaacgctg ggccgagcgc aaagcgttat 300 
taacccatga cgatgtgaaa caacgcgcat ggcaaacgct gaaatggcag attgccaacg 3 60 
gcattcagca tgtgcgtacc catgtcgatg tttcggatgc aacgctaact gcgctgaaag 420 
caatgctgga agtgaagcag gaagtcgcgc cgtggattga tctgcaaatc gtcgccttcc 480 
ctcaggaagg gattttgtcg gatcc 505 

<210> 53 
<211> 27 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreib%ing der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 53 

gtcaacgtaa ccaaccctgc 20 

<210> 54 
<211> 26 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kOnstlichen Sequenz: 
oligonucleotide primer 

<400> 54 

ggatccgaca aaatcccttc ctgagg 26 
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<210> 55 
<211> 5674 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibiong der kiinstlichen Sequenz: vector 
construct pBlxiKS-nitP-STIiSl-SSS-T 

<400> 55 

ccagcttttg ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc 60 
tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca 120 
taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct 180 
cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac 2 40 
gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc 3 00 
tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt 3 60 
tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg 420 
ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg 480 
agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat 540 
accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta 600 
ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct 660 
gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc 720 
ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa 780 
gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg 840 
taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag 900 
tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt 960 
gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta 1020 
cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc 1080 
agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca 1140 
cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa 1200 
cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat 1260 
ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct 1320 
taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt 1380 
tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat 1440 
ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta 1500 
atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg 1560 
gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt 1620 
tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg 1680 
cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg 1740 
taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc 1800 
ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa 1860 
ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac 192 0 
cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt 1980 
ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg 2 040 
gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa 2100 
gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata 2160 
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgcg ccctgtagcg 2220 
gcgcattaag cgcggcgggt gtggtggtta cgcgcagcgt gaccgctaca cttgccagcg 2280 
ccctagcgcc cgctcctttc gctttcttcc cttcctttct cgccacgttc gccggctttc 2340 
cccgtcaagc tctaaatcgg gggctccctt tagggttccg atttagtgct ttacggcacc 2400 
tcgaccccaa aaaacttgat tagggtgatg gttcacgtag tgggccatcg ccctgataga 2460 
cggtttttcg ccctttgacg ttggagtcca cgttctttaa tagtggactc ttgttccaaa 2520 
ctggaacaac actcaaccct atctcggtct attcttttga tttataaggg attttgccga 2580 
tttcggccta ttggttaaaa aatgagctga tttaacaaaa atttaacgcg aattttaaca 2 640 
aaatattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 2700 
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 27 60 
attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 2820 
attgtaatac gactcactat agggcgaatt ggagctcgtc gagaccagat gttttacact 2880 
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tgaccgtaaa tgagcacccg aagaaaccgg tcacattcat ttcgaaggtg gagaaagcgg 2940 
aagatgactc aaacaagtaa tcggttgtga ttcgtcagtt catgtcactc ctatgaagga 3 000 
gtcaagttca aaatgttatg ttgagtttca aacttttatg ctaaactttt tttctttatt 3 060 
fctcgttaata atggaagaga accaattctc ttgtatctaa agattatcca tctatcatcc 3120 
aatttgagtg ttcaattctg gatgttgtgt taccctacat tctacaacca tgtagccaat 3180 
tattatgaat ctggctttga tttcagttgt gttcttttct tttttttctt tgcatatttg 3240 
catttagaat gtttaataat taagttactg tatttccaca tacattagtt ccaagaatat 3300 
acatatatta atttattttt cttaaaaatg ttttggaatg actaatattg acaacgaaaa 3360 
tagaagctat gctaaaccat tacgtatatg tgacttcaca tgttgttgtt ttacattccc 3420 
tatatatatg gatggctgtc acaatcagaa acgtgatcga aaaaagacaa acagtgtttg 3 480 
cataaaaaga ctatttcgtt tcattgacaa tttgtgttta tttgtaaaga aaagtggcaa 3 540 
agtggaattt gagttcctgc aagtaagaaa gatgaaataa aagacttgag tgtgtgtttt 3 600 
tttcttttat ctgaaagctg caatgaaata ttcctaccaa gcccgtttga ttattaattg 3 660 
gggtttggtt ttcttgatgc gaactaattg gttatataag aaactataca atccatgtta 3720 
attcaaaaat tttgatttct cttgtaggaa tatgatttac tatatgagac tttcttttcg 3780 
ccaataatag taaatccaaa gatatttgac cggaccaaaa cacattgatc tattttttag 3 840 
tttatttaat ccagtttctc tgagataatt cattaaggaa aacttagtat taacccatcc 3900 
taagattaaa taggagccaa actcacattt caaatattaa ataacataaa atggatttaa 3960 
aaaatctata cgtcaaattt tatttatgac atttcttatt taaatttata tttaatgaaa 4020 
tacagctaag acaaaccaaa aaaaaaatac tttctaagtg gtccaaaaca tcaattccgt 4080 
tcaatattat taggtagaat cgtacgacca aaaaaaggta ggttaatacg aattagaaac 4140 
atatctataa catagtatat attattacct attatgagga atcaaaatgc atcaaatatg 4200 
gatttaagga atccataaaa gaataaattc tacgggaaaa aaaatggaat aaattctttt 4260 
aagtttttta tttgtttttt atttggtagt tctccatttt gttttatttc gtttggattt 432 0 
attgtgtcca aatactttgt aaaccaccgt tgtaattctt aaacggggtt ttcacttctt 43 80 
ttttatattc agacataaag catcggctgg tttaatcaat caatagattt tatttttctt 4440 
ctcaattatt agtaggtttg atgtgaactt tacaaaaaaa acaaaaacaa atcaatgcag 4500 
agaaaagaaa ccacgtgggc tagtcccacc ttgtttcatt tccaccacag gttcgatctt 4560 
cgttaccgtc tccaatagga aaataaacgt gaccacaaaa aaaaaacaaa aaaaagtcta 4620 
tatattgctt ctctcaagtc tctgagtgtc atgaaccaaa gtaaaaaaca aagactcgac 4680 
ctgcaggcat gcaagcttat cgtcgactac gtaagtttct gcttctacct ttgatatata 4740 
tataataatt atcattaatt agtagtaata taatatttca aatatttttt tcaaaataaa 4800 
agaatgtagt atatagcaat tgcttttctg tagtttataa gtgtgtatat tttaatttat 4860 
aacttttcta atatatgacc aaaatttgtt gatgtgcagg tatcaccgga tccatcgaat 4920 
tcggtacgct gaaatcacca gtctctctct acaaatctat ctctctctat tttctccata 4980 
aataatgtgt gagtagtttc ccgataaggg gaanttaggg ttcttatagg gtttcgctca 5040 
tgtgttgagc atataagaaa cccttagtat gtatttgtat ttgtaaaata cttctatcaa 5100 
taaaatttct aattcctaaa accaaaatcc agtactaaaa tccagatctc ctaaagtccc 5160 
tatagatctt tgtcgtgaat ataaaccaga cacgagacga ctaaacctgg agcccagacg 5220 
ccgttcgaag ctagaagtac cgcttaggca ggaggccgtt agggaaaaga tgctaaggca 5280 
gggttggtta cgttgactcc cccgtaggtt tggtttaaat atgatgaagt ggacggaagg 5340 
aaggaggaag acaaggaagg ataaggttgc aggccctgtg caaggtaaga agatggaaat 5400 
ttgatagagg tacgctacta tacttatact atacgctaag ggaatgcttg tatttatacc 5460 
ctataccccc taataacccc ttatcaattt aagaaataat ccgcataagc ccccgcttaa 5520 
aaattggtat cagagccatg aataggtcta tgaccaaaac tcaagaggat aaaacctcac 5580 
caaaatacga aagagttctt aactctaaag ataaaagatc tttcaagatc aaaactagtt 5640 
ccctcacacc ggtgacgggg atcgcgatgg gtac 5674 

<210> 56 
<211> 6046 
<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kOnstliclien Sequenz: binary 
vector psrONl 

<400> 56 

ttccatggac atacaaatgg acgaacggat aaaccttttc acgccctttt aaatatccga 60 
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ttattctaat 
gatagtttaa 
tgattacgcc 
cgggctcgag 
ggtaataatt 
gacaagtatc 
ttgtctaagc 
ccccgaccgg 
ggtgttgacc 
ccggagcggg 
caccccggca 
agaggcggct 
cgaggaagtg 
cgaggccgac 
caccaggacg 
gcggccgggt 
ctggccggtt 
accgagcgcc 
gtcgctgcgt 
ttatcgctgt 
cccgcgccct 
gtgcccgcga 
gcccgacgat 
gagcgcccca 
ttccggtgca 
agcagcgcat 
tcaaaggcac 
ttcttgagtc 
ccgttcttga 
aaattaaatc 
cacgctaagt 
ggcagacacg 
gctgaagatg 
cgcgcagcta 
aaggaggcgg 
gtggaggaac 
gcactggaac 
acaaatcggc 
ccagcggcaa 
tcgaatccgc 
gcccaagggc 
cgatagtcgc 
tggcgaggtg 
cggcatggcc 
atccatgaac 
cgttgcggac 
ggtagaaacc 
caagaacggc 
cgtaaagagc 
ccgcgagatc 
gatcgatccc 
agaagccaga 
gaagttctgt 
gaaggaggag 
gggcgaagca 
aggggaaaaa 
gccgtacatt 



aaacgctctt 
actgaaggcg 
aagcttgcat 
gtaccgagct 
gtcattagat 
aaacggatgt 
gtcaatttgt 
cagctcggca 
gtgttcgccg 
cgcgaggccg 
cagatcgcgc 
gcactgcttg 
acgcccaccg 
gccctggcgg 
gccaggacga 
acgtgttcga 
tgtctgatgc 
gccgtctaaa 
atatgatgcg 
acttaaccag 
gcaactcgcc 
ttgggcggcc 
tgaccgcgac 
ggcggcggac 
gccaagccct 
tgaggtcacg 
gcgcatcggc 
ccgtatcacg 
atcagaaccc 
aaaactcatt 
gccggccgtc 
ccagccatga 
tacgcggtac 
ccagagtaaa 
catggaaaat 
gggcggttgg 
ccccaagccc 
gcggcgctgg 
cgcatcgagg 
aaagaatccc 
gacgagcaac 
agcatcatgg 
atccgctacg 
agtgtgtggg 
cgataccggg 
gtactcaagt 
tgcattcggt 
cgcctggtga 
gaaaccgggc 
acagaaggca 
ggcatcggcc 
tggttgttca 
ttcaccgtgc 
gcggggcagg 
tccgccggtt 
ggtcgaaaag 
gggaaccgga 



ttctcttagg 



ggaaacgaca 
gcctgcaggt 
cgaattcact 
tgtttttatg 
taattcagta 
ttacaccaca 
caaaatcacc 
gcattgccga 
ccaaggcccg 
acgcccgcga 
gcgtgcatcg 
aggccaggcg 
ccgccgagaa 
accgtttttc 
gccgcccgcg 
caagctggcg 
aaggtgatgt 
atgagtaaat 
aaaggcgggt 
ggggccgatg 
gtgcgggaag 
gtgaaggcca 
ttggctgtgt 
tacgacatat 
gatggaaggc 
ggtgaggttg 
cagcgcgtga 
gagggcgacg 
tgagttaatg 
cgagcgcacg 
agcgggtcaa 
gccaaggcaa 
tgagcaaatg 
caagaacaac 
ccaggcgtaa 
gaggaatcgg 
gtgatgacct 
cagaagcacg 
ggcaaccgcc 
cagatttttt 
acgtggccgt 
agcttccaga 
attacgacct 
aagggaaggg 
tctgccggcg 
taaacaccac 
cggtatccga 
ggccggagta 
agaacccgga 
gttttctcta 
agacgatcta 
gcaagctgat 
ctggcccgat 
cctaatgtac 
gtctctttcc 
acccgtacat 



74 

tttacccgcc 
atcagatcta 
cgactctaga 
ggccgtcgtt 
catagatgca 
cattaaagac 
atatatcctg 
acgcgttacc 
gttcgagcgt 
aggcgtgaag 
gctgatcgac 
ctcgaccctg 
gcgcggtgcc 
tgaacgccaa 
attaccgaag 
cacgtctcaa 
gcctggccgg 
gtatttgagt 
aaacaaatac 
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aatatatcct 
gtaggaaaca 
ctagtggatc 
ttacaacgac 
ctcgaaatca 
gtccgcaatg 
ccaccagcca 



caggcaagac 
ttctgttagt 
atcaaccgct 
tcggccggcg 
ccgcgatcaa 
gggccaccgc 
tacaagcggc 
ccgaggcgct 
gctacccagg 
Gtgcccgcga 
aggtaaagag 
cagcagcaag 
ctttcagttg 
gaccattacc 
aataaatgag 
caggcaccga 
gcggctgggt 
cgtgagcggt 
ggtggagaag 
ccccggtgaa 
ggcagccggt 
cgttccgatg 
tttccgtctg 
cgggcacgta 
ggtactgatg 
agacaagccc 
agccgatggc 
gcacgttgcc 

gggtgaagcc 

catcgagatc 
cgtgctgacg 
ccgcctggca 
cgaacgcagt 
cgggtcaaat 
cctagtcatg 
ggagcagatg 
tgtggatagc 
tgggaaccca 



accacgccgg 
tccctaatca 
tttggccccc 
caggaaggcc 
taccgcgcac 
ttccgtgagg 
gaggaacaag 
agatcgaggc 
ccgtgcggct 
ccagcttggc 
aaaacagctt 
gcaaggggaa 
gaccatcgca 
cgattccgat 
aaccgttgtc 
cgacttcgta 
ggcagccgac 
cgacctggtg 
ctttgtcgtg 
ggccgggtac 
cactgccgcc 
ggtccaggcg 
aaaatgagca 
gctgcaacgt 
ccggcggagg 
gagctgctat 
tagatgaatt 
cgccgtggaa 
tgtctgccgg 
cgcaaaccat 
ttgaaggccg 
tcgtggcaag 
gcgccgtcga 
ctctatgacg 
tcgaagcgtg 
gaggtttccg 
gcggtttccc 
ggccgcgtgt 
ggaaagcaga 
atgcagcgta 
ttgattagcc 
gage t age tg 
gttcaccccg 
cgccgcgccg 
ggcagcgccg 
gacctgccgg 
cgctaccgca 
ctagggcaaa 
acgtacattg 
aagccgtaca 



gtcaaacact 
gctatgacca 
cgatatcgcc 
tcagctgctt 
gccaatttta 
tgttattaag 
gccaacagct 
ccggccgcat 
tcgaccgcac 
gccctaccct 
gcaccgtgaa 
ttgagcgcag 
acgcattgac 
catgaaaccg 
ggagatgatc 
gcatgaaatc 
cgctgaagaa 
gcgtcatgcg 
cgcatgaagg 
acccatctag 
ccccagggca 
ggcatcgacc 
gtgatcgacg 
ttcgtgctga 
gagctggtta 
tcgcgggcga 
gagctgccca 
gccggcacaa 
ctggccgctg 
aaagcacaaa 
tggccagcct 
atcacaccaa 
ctgaatacat 
ttagcggcta 
tgccccatgt 
ccctgcaatg 
ccggcccggt 
cgcaggccgc 
cggccgctga 
ttaggaagcc 
tgggcacccg 
accgacgagc 
cagggccggc 
atctaaccga 
tccgtccaca 
aagacgacct 
cgaagaaggc 
gctacaagat 
attggatgta 
attacttttt 
caggcaaggc 
gagagttcaa 
agtacgattt 
acctgatcga 
ttgccctagc 
ggaacccaaa 
ttgggaaccg 



120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
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gtcacacatg 
tttaaaactt 
cacagccgaa 
cgcttcgcgt 
caatctacca 
aggcaccctg 
cggagacggt 
cgtcagcggg 
gagtgtatac 
gcggtgtgaa 
ttcctcgctc 
ctcaaaggcg 
agcaaaaggc 
taggctccgc 
cccgacagga 
tgttccgacc 
gctttctcat 

gggctgtgtg 

tcttgagtcc 

gattagcaga 

cggctacact 

aaaaagagtt 

tgtttgcaag 

ttctacgggg 

tgatatatct 

cttgacctga 

agccgcgccg 

taccttggtg 

ggccaagcga 

atactgggcc 

gccggttact 

agcccagtcg 

ctgttcagga 

ttctcttgct 

acctgcaaga 

acgccacgga 

gctctctcca 

ttcatcaagc 

gccatccact 

gatgacgcca 

gatgtttaac 

catcaaacat 

taccccaaaa 



taagtgactg 

attaaaactc 

gagctgcaaa 

cggcctatcg 

gggcgcggac 

cctcgcgcgt 

cacagcttgt 

tgttggcggg 

tggcttaact 

ataccgcaca 

actgactcgc 

gtaatacggt 

cagcaaaagg 

ccccctgacg 

ctataaagat 

ctgccgctta 

agctcacgct 

cacgaacccc 

aacccggtaa 

gcgaggtatg 

agaaggacag 

ggtagctctt 

cagcagatta 

tctgacgctc 

cccaatttgt 

tagtttggct 

cgaagcggcg 

atctcgcctt 

tcttcttctt 

ggcaggcgct 

gcgctgtacc 

ggcggcgagt 

accggatcaa 

tttgtcagca 

atgtcattgc 

atgatgtcgt 

ggggaagccg 

cttacggtca 

gcggagccgt 

actacctctg 

tttgttttag 

cgacccacgg 

aaacagtcat 



atataaaaga 

ttaaaacccg 

aagcgcctac 

cggccgctgg 

aagccgcgcc 

ttcggtgatg 

ctgtaagcgg 

tgtcggggcg 

atgcggcatc 

gatgcgtaag 

tgcgctcggt 

tatccacaga 

ccaggaaccg 

agcatcacaa 

accaggcgtt 

ccggatacct 

gtaggtatct 

ccgttcagcc 

gacacgactt 

taggcggtgc 

tatttggtat 

gatccggcaa 

cgcgcagaaa 

agtggaacga 

gtagggctta 

gtgagcaatt 

tcggcttgaa 

tcacgtagtg 

gtccaagata 

ccattgccca 

aaatgcggga 

tccatagcgt 

agagttcctc 

agatagccag 

gctgccattc 

cgtgcacaac 

aagtttccaa 

ccgtaaccag 

acaaatgtac 

atagttgagt 

ggcgactgcc 

cgtaacgcgc 

aacaagccat 



gaaaaaaggc 

cctggcctgt 

ccttcggtcg 

ccgctcaaaa 

gtcgccactc 

acggtgaaaa 

atgccgggag 

cagccatgac 

agagcagatt 

gagaaaatac 

cgttcggctg 

atcaggggat 

taaaaaggcc 

aaatcgacgc 

tccccctgga 

gtccgccttt 

cagttcggtg 

cgaccgctgc 

atcgccactg 

tacagagttc 

ctgcgctctg 

acaaaccacc 

aaaaggatct 

aaactcacgt 

ttatgcacgc 

atgtgcttag 

cgaatttcta 

gacaaattct 

agcctgtcta 

gtcggcagcg 

caacgtaagc 

taaggtttca 

cgecgctgga 

atcaatgtcg 

tccaaattgc 

aatggtgact 

aaggtcgttg 

caaatcaata 

ggccagcaac 

cgatacttcg 

ctgctgcgta 

ttgctgcttg 

gaaaaccgcc 



gatttttccg 
gcataactgt 
ctgcgctccc 
atggctggcc 
gaccgccggc 
cctctgacac 
cagacaagcc 
ccagtcacgt 
gtactgagag 
cgcatcaggc 
cggcgagcgg 
aacgcaggaa 
gcgttgctgg 
tcaagtcaga 
agctccctcg 
ctcccttcgg 
taggtcgttc 
gccttatccg 
gcagcagcca 
ttgaagtggt 
ctgaagccag 
gctggtagcg 
caagaagatc 
taagggattt 
ttaaaaataa 
tgcatctaac 
gctagacatt 
tccaactgat 
gcttcaagta 
acatccttcg 
actacatttc 
tttagcgcct 
cctaccaagg 
atcgtggctg 
agttcgcgct 
tctacagcgc 
atcaaagctc 
tcactgtgtg 
gtcggttcga 
gcgatcaccg 
acatcgttgc 
gatgcccgag 
actgcg 



cctaaaactc 3540 
ctggccagcg 3 600 
tacgccccgc 3 660 
tacggccagg 3720 
gcccacatca 3780 
atgcagctcc 3 840 
cgtcagggcg 3900 
agcgatagcg 3960 
tgcaccatat 4020 
gctcttccgc 4080 
tatcagctca 4140 
agaacatgtg 4200 
cgtttttcca 4260 
ggtggcgaaa 4320 
tgcgctctcc 4380 
gaagcgtggc 4440 
gctccaagct 4500 
gtaactatcg 4560 
ctggtaacag 4620 
ggcctaacta 4680 
ttaccttcgg 4740 
gtggtttttt 4800 
ctttgatctt 4860 
tggtcatgca 492 0 
taaaagcaga 4980 
gcttgagtta 5040 
atttgccgac 5100 
ctgcgcgcga 5160 
tgacgggctg 522 0 
gcgcgatttt 5280 
gctcatcgcc 5340 
caaatagatc 5400 
caacgctatg 5460 
gctcgaagat 5520 
tagctggata 5580 
ggagaatctc 5640 
gccgcgttgt 5700 
gcttcaggcc 5760 
gatggcgctc 582 0 
cttcccccat 5880 
tgctccataa 5940 
gcatagactg 6000 
6046 



<210> 57 
<211> 9838 

<212> DNA 

<213> Kunstliche Se<3uenz 
<220> 

<223> Beschreibung der kiinst lichen Sequenz: Transgenic 
expression vector for codA dsRNA pSUNl-codA-KNAi 



<400> 57 

cgaattcact 

tgtttttatg 

taattcagta 

ttacaccaca 

caaaatcacc 



ggccgtcgtt 
catagatgca 
cattaaagac 
atatatcctg 
acgcgttacc 



ttacaacgac 
ctcgaaatca 
gtccgcaatg 
ccaccagcca 
accacgccgg 



tcagctgctt 
gccaatttta 
tgttattaag 
gccaacagct 
ccggccgcat 



ggtaataatt 
gacaagtatc 
ttgtctaagc 
ccccgaccgg 
ggtgttgacc 



gtcattagat 60 
aaacggatgt 120 
gtcaatttgt 180 
cagctcggca 240 
gtgttcgccg 300 
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gcattgccga gttcgagcgt tccctaatca tcgaccgcac ccggagcggg cgcgaggccg 360 
ccaaggcccg aggcgtgaag tttggccccc gccctaccct caccccggca cagatcgcgc 420 
acgcccgcga gctgatcgac caggaaggcc gcaccgtgaa agaggcggct gcactgcttg 480 
gcgtgcatcg ctcgaccctg taccgcgcac ttgagcgcag cgaggaagtg acgcccaccg 540 
aggccaggcg gcgcggtgcc ttccgtgagg acgcattgac cgaggccgac gccctggcgg 600 
ccgccgagaa tgaacgccaa gaggaacaag catgaaaccg caccaggacg gccaggacga 660 
accgtttttc attaccgaag agatcgaggc ggagatgatc gcggccgggt acgtgttcga 720 
gccgcccgcg cacgtctcaa ccgtgcggct gcatgaaatc ctggccggtt tgtctgatgc 780 
caagctggcg gcctggccgg ccagcttggc cgctgaagaa accgagcgcc gccgtctaaa 840 
aaggtgatgt gtatttgagt aaaacagctt gcgtcatgcg gtcgctgcgt atatgatgcg 900 
atgagtaaat aaacaaatac gcaaggggaa cgcatgaagg ttatcgctgt acttaaccag 960 
aaaggcgggt caggcaagac gaccatcgca acccatctag cccgcgccct gcaactcgcc 1020 
ggggccgatg ttctgttagt cgattccgat ccccagggca gtgcccgcga ttgggcggcc 1080 
gtgcgggaag atcaaccgct aaccgttgtc ggcatcgacc gcccgacgat tgaccgcgac 1140 
gtgaaggcca tcggccggcg cgacttcgta gtgatcgacg gagcgcccca ggcggcggac 1200 
ttggctgtgt ccgcgatcaa ggcagccgac ttcgtgctga ttccggtgca gccaagccct 1260 
tacgacatat gggccaccgc cgacctggtg gagctggtta agcagcgcat tgaggtcacg 1320 
gatggaaggc tacaagcggc ctttgtcgtg tcgcgggcga tcaaaggcac gcgcatcggc 1380 
ggtgaggttg ccgaggcgct ggccgggtac gagctgccca ttcttgagtc ccgtatcacg 1440 
cagcgcgtga gctacccagg cactgccgcc gccggcacaa ccgttcttga atcagaaccc 1500 
gagggcgacg ctgcccgcga ggtccaggcg ctggccgctg aaattaaatc aaaactcatt 1560 
tgagttaatg aggtaaagag aaaatgagca aaagcacaaa cacgctaagt gccggccgtc 162 0 
cgagcgcacg cagcagcaag gctgcaacgt tggccagcct ggcagacacg ccagccatga 1680 
agcgggtcaa ctttcagttg ccggcggagg atcacaccaa gctgaagatg tacgcggtac 1740 
gccaaggcaa gaccattacc gagctgctat ctgaatacat cgcgcagcta ccagagtaaa 1800 
tgagcaaatg aataaatgag tagatgaatt ttagcggcta aaggaggcgg catggaaaat 1860 
caagaacaac caggcaccga cgccgtggaa tgccccatgt gtggaggaac gggcggttgg 1920 
ccaggcgtaa gcggctgggt tgtctgccgg ccctgcaatg gcactggaac ccccaagccc 1980 
gaggaatcgg cgtgagcggt cgcaaaccat ccggcccggt acaaatcggc gcggcgctgg 2040 
gtgatgacct ggtggagaag ttgaaggccg cgcaggccgc ccagcggcaa cgcatcgagg 2100 
cagaagcacg ccccggtgaa tcgtggcaag cggccgctga tcgaatccgc aaagaatccc 2160 
ggcaaccgcc ggcagccggt gcgccgtcga ttaggaagcc gcccaagggc gacgagcaac 2220 
cagatttttt cgttccgatg ctctatgacg tgggcacccg cgatagtcgc agcatcatgg 22 80 
acgtggccgt tttccgtctg tcgaagcgtg accgacgagc tggcgaggtg atccgctacg 2340 
agcttccaga cgggcacgta gaggtttccg cagggccggc cggcatggcc agtgtgtggg 2400 
attacgacct ggtactgatg gcggtttccc atctaaccga atccatgaac cgataccggg 2460 
aagggaaggg agacaagccc ggccgcgtgt tccgtccaca cgttgcggac gtactcaagt 2520 
tctgccggcg agccgatggc ggaaagcaga aagacgacct ggtagaaacc tgcattcggt 2580 
taaacaccac gcacgttgcc atgcagcgta cgaagaaggc caagaacggc cgcctggtga 2640 
cggtatccga gggtgaagcc ttgattagcc gctacaagat cgtaaagagc gaaaccgggc 2700 
ggccggagta catcgagatc gagctagctg attggatgta ccgcgagatc acagaaggca 2760 
agaacccgga cgtgctgacg gttcaccccg attacttttt gatcgatccc ggcatcggcc 2820 
gttttctcta ccgcctggca cgccgcgccg caggcaaggc agaagccaga tggttgttca 2880 
agacgatcta cgaacgcagt ggcagcgccg gagagttcaa gaagttctgt ttcaccgtgc 2940 
gcaagctgat cgggtcaaat gacctgccgg agtacgattt gaaggaggag gcggggcagg 3000 
ctggcccgat cctagtcatg cgctaccgca acctgatcga gggcgaagca tccgccggtt 3060 
cctaatgtac ggagcagatg ctagggcaaa ttgccctagc aggggaaaaa ggtcgaaaag 3120 
gtctctttcc tgtggatagc acgtacattg ggaacccaaa gccgtacatt gggaaccgga 3180 
acccgtacat tgggaaccca aagccgtaca ttgggaaccg gtcacacatg taagtgactg 3240 
atataaaaga gaaaaaaggc gatttttccg cctaaaactc tttaaaactt attaaaactc 3300 
ttaaaacccg cctggcctgt gcataactgt ctggccagcg cacagccgaa gagctgcaaa 3360 
aagcgcctac ccttcggtcg ctgcgctccc tacgccccgc cgcttcgcgt cggcctatcg 3420 
cggccgctgg ccgctcaaaa atggctggcc tacggccagg caatctacca gggcgcggac 3480 
aagccgcgcc gtcgccactc gaccgccggc gcccacatca aggcaccctg cctcgcgcgt 3540 
ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt cacagcttgt 3 600 
ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg 3 660 
tgtcggggcg cagccatgac ccagtcacgt agcgatagcg gagtgtatac tggcttaact 3720 
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atgcggcatc agagcagatt gtactgagag 
gatgcgtaag gagaaaatac cgcatcaggc 
tgcgctcggt cgttcggctg cggcgagcgg 
tatccacaga atcaggggat aacgcaggaa 
ccaggaaccg taaaaaggcc gcgttgctgg 
agcatcacaa aaatcgacgc tcaagtcaga 
accaggcgtt tccccctgga agctccctcg 
ccggatacct gtccgccttt ctcccttcgg 
gtaggtatct cagttcggtg taggtcgttc 
ccgttcagcc cgaccgctgc gccttatccg 
gacacgactt atcgccactg gcagcagcca 
taggcggtgc tacagagttc ttgaagtggt 
tatttggtat ctgcgctctg ctgaagccag 
gatccggcaa acaaaccacc gctggtagcg 
cgcgcagaaa aaaaggatct caagaagatc 
agtggaacga aaactcacgt taagggattt 
gtagggctta ttatgcacgc ttaaaaataa 
gtgagcaatt atgtgcttag tgcatctaac 
tcggcttgaa cgaatttcta gctagacatt 
tcacgtagtg gacaaattct tccaactgat 
gtccaagata agcctgtcta gcttcaagta 
ccattgccca gtcggcagcg acatccttcg 
aaatgcggga caacgtaagc actacatttc 
tccatagcgt taaggtttca tttagcgcct 
agagttcctc cgccgctgga cctaccaagg 
agatagccag atcaatgtcg atcgtggctg 
gctgccattc tccaaattgc agttcgcgct 
cgtgcacaac aatggtgact tctacagcgc 
aagtttccaa aaggtcgttg atcaaagctc 
ccgtaaccag caaatcaata tcactgtgtg 
acaaatgtac ggccagcaac gtcggttcga 
atagttgagt cgatacttcg gcgatcaccg 
ggcgactgcc ctgctgcgta acatcgttgc 
cgtaacgcgc ttgctgcttg gatgcccgag 
aacaagccat gaaaaccgcc actgcgttcc 
cttttcacgc ccttttaaat atccgattat 
cccgccaata tatcctgtca aacactgata 
gatctagtag gaaacagcta tgaccatgat 
tctagactag tggatccgat atcgcccggg 
ggtgtgaggg aactagtttt gatcttgaaa 
tcgtattttg gtgaggtttt atcctcttga 
ataccaattt ttaagcgggg gcttatgcgg 
gggggtafcag ggtataaata caagcattcc 
cctctatcaa atttccatct tcttaccttg 
cttcctcctt ccttccgtcc acttcatcat 
taaccaaccc tgccttagca tcttttccct 
cttcgaacgg cgtctgggct ccaggtttag 
aagatctata gggactttag gagatctgga 
agaaatttta ttgatagaag tattttacaa 
gctcaacaca tgagcgaaac cctataagaa 
acacattatt tatggagaaa atagagagag 
agcgtaccga attcggctaa cagtgtcgaa 
gttaccaggc gaagaggggc tgtggcagat 
tgatgcgcaa tccggcgtga tgcccataac 
agttataccg ccgtttgtgg agccacatat 
accgaactgg aatcagtccg gcacgctgtt 
agcgttatta acccatgacg atgtgaaaca 



tgcaccatat gcggtgtgaa ataccgcaca 3780 
gctcttccgc ttcctcgctc actgactcgc 3840 
tatcagctca ctcaaaggcg gtaatacggt 3900 
agaacatgtg agcaaaaggc cagcaaaagg 3960 
cgtttttcca taggctccgc ccccctgacg 4020 
ggtggcgaaa cccgacagga ctataaagat 4080 
tgcgctctcc tgttccgacc ctgccgctta 4140 
gaagcgtggc gctttctcat agctcacgct 4200 
gctccaagct gggctgtgtg cacgaacccc 4260 
gtaactatcg tcttgagtcc aacccggtaa 432 0 
ctggtaacag gattagcaga gcgaggtatg 4380 
ggcctaacta cggctacact agaaggacag 4440 
ttaccttcgg aaaaagagtt ggtagctctt 4500 
gtggtttttt tgtttgcaag cagcagatta 4560 
ctttgatctt ttctacgggg tctgacgctc 4620 
tggtcatgca tgatatatct cccaatttgt 4680 
taaaagcaga cttgacctga tagtttggct 4740 
gcttgagtta agccgcgccg cgaagcggcg 4800 
atttgccgac taccttggtg atctcgcctt 4860 
ctgcgcgcga ggccaagcga tcttcttctt 4920 
tgacgggctg atactgggcc ggcaggcgct 4980 
gcgcgatttt gccggttact gcgctgtacc 5040 
gctcatcgcc agcccagtcg ggcggcgagt 5100 
caaat agate ctgttcagga accggatcaa 5160 
caacgctatg ttctcttgct tttgtcagca 5220 
gctcgaagat acctgcaaga atgtcattgc 5280 
tagctggata acgccacgga atgatgtcgt 5340 
ggagaatctc gctctctcca ggggaagccg 5400 
gccgcgttgt ttcatcaagc cttacggtca 5460 
gcttcaggcc gccatccact gcggagccgt 5520 
gatggcgctc gatgacgcca actacctctg 5580 
cttcccccat gatgtttaac tttgttttag 5640 
tgctccataa catcaaacat cgacccacgg 5700 
gcatagactg taccccaaaa aaacagtcat 5760 
atggacatac aaatggacga acggataaac 5820 
tctaataaac gctcttttct cttaggttta 5880 
gtttaaactg aaggcgggaa acgacaatca 5940 
tacgccaagc ttgcatgcct gcaggtcgac 6000 
ctcgaggtac ccatcgcgat ccccgtcacc 6060 
gatcttttat ctttagagtt aagaactctt 6120 
gttttggtca tagacctatt catggctctg 6180 
attatttctt aaattgataa ggggttatta 6240 
cttagcgtat agtataagta tagtagcgta 6300 
cacagggcct gcaaccttat ccttccttgt 6360 
atttaaacca aacctacggg ggagtcaacg 642 0 
aacggcctcc tgcctaagcg gtacttctag 6480 
tcgtctcgtg tctggtttat attcacgaca 6540 
ttttagtact ggattttggt tttaggaatt 6600 
atacaaatac atactaaggg tttcttatat 6660 
ccctaanttc cccttatcgg gaaactactc 672 0 
atagatttgt agagagagac tggtgatttc 6780 
taacgcttta caaacaatta ttaacgcccg 6840 
tcatctgcag gacggaaaaa tcagcgccat 6900 
tgaaaacagc ctggatgccg aacaaggttt 69 60 
tcacctggac accacgcaaa ccgccggaca 702 0 
tgaaggcatt gaacgctggg ccgagcgcaa 7080 
acgcgcatgg caaacgctga aatggcagat 7140 
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tgccaacggc attcagcatg tgcgtaccca tgtcgatgtt tcggatgcaa cgctaactgc 7200 
gctgaaagca atgctggaag tgaagcagga agtcgcgccg tggattgatc tgcaaatcgt 7260 
cgccttccct caggaaggga ttttgtcgga tccggtgata cctgcacatc aacaaatttt 7320 
ggtcatatat tagaaaagtt ataaattaaa atatacacac ttataaacta cagaaaagca 7380 
attgctatat actacattct tttattttga aaaaaatatt tgaaatatta tattactact 7440 
aattaatgat aattattata tatatatcaa aggtagaagc agaaacttac gtagtcgacg 7500 
acaaaatccc ttcctgaggg aaggcgacga tttgcagatc aatccacggc gcgacttcct 7560 
gcttcacttc cagcattgct ttcagcgcag ttagcgttgc atccgaaaca tcgacatggg 7620 
tacgcacatg ctgaatgccg ttggcaatct gccatttcag cgtttgccat gcgcgttgtt 7680 
tcacatcgtc atgggttaat aacgctttgc gctcggccca gcgttcaatg ccttcaaaca 7740 
gcgtgccgga ctgattccag ttcggttgtc cggcggtttg cgtggtgtcc aggtgaatat 7800 
gtggctccac aaacggcggt ataactaaac cttgttcggc atccaggctg ttttcagtta 7860 
tgggcatcac gccggattgc gcatcaatgg cgctgatttt tccgtcctgc agatgaatct 7920 
gccacagccc ctcttcgcct ggtaaccggg cgttaataat tgtttgtaaa gcgttattcg 7980 
acactgttag ccaagcttgc atgcctgcag gtcgagtctt tgttttttac tttggttcat 8040 
gacactcaga gacttgagag aagcaatata tagacttttt tttgtttttt ttttgtggtc 8100 
acgtttattt tcctattgga gacggtaacg aagatcgaac ctgtggtgga aatgaaacaa 8160 
ggtgggacta gcccacgtgg tttcttttct ctgcattgat ttgtttttgt tttttttgta 8220 
aagttcacat caaacctact aataattgag aagaaaaata aaatctattg attgattaaa 8280 
ccagccgatg ctttatgtct gaatataaaa aagaagtgaa aaccccgttt aagaattaca 8340 
acggtggttt acaaagtatt tggacacaat aaatccaaac gaaataaaac aaaatggaga 8400 
actaccaaat aaaaaacaaa taaaaaactt aaaagaattt attccatttt ttttcccgta 8460 
gaatttattc ttttatggat tccttaaatc catatttgat gcattttgat tcctcataat 852 0 
aggtaataat atatactatg ttatagatat gtttctaatt cgtattaacc tacctttttt 8580 
tggtcgtacg attctaccta ataatattga acggaattga tgttttggac cacttagaaa 8640 
gtattttttt tttggtttgt cttagctgta tttcattaaa tataaattta aataagaaat 8700 
gtcataaata aaatttgacg tatagatttt ttaaatccat tttatgttat ttaatatttg 8760 
aaatgtgagt ttggctccta tttaatctta ggatgggtta atactaagtt ttccttaatg 8820 
aattatctca gagaaactgg attaaataaa ctaaaaaata gatcaatgtg ttttggtccg 8880 
gtcaaatatc tttggattta ctattattgg cgaaaagaaa gtctcatata gtaaatcata 8940 
ttcctacaag agaaatcaaa atttttgaat taacatggat tgtatagttt cttatataac 9000 
caattagttc gcatcaagaa aaccaaaccc caattaataa tcaaacgggc ttggtaggaa 9060 
tatttcattg cagctttcag ataaaagaaa aaaacacaca ctcaagtctt ttatttcatc 9120 
tttcttactt gcaggaactc aaattccact ttgccacttt tctttacaaa taaacacaaa 9180 
ttgtcaatga aacgaaatag tctttttatg caaacactgt ttgtcttttt tcgatcacgt 9240 
ttctgattgt gacagccatc catatatata gggaatgtaa aacaacaaca tgtgaagtca 9300 
catatacgta atggtttagc atagcttcta ttttcgttgt caatattagt cattccaaaa 93 60 
catttttaag aaaaataaat taatatatgt atattcttgg aactaatgta tgtggaaata 9420 
cagtaactta attattaaac attctaaatg caaatatgca aagaaaaaaa agaaaagaac 9480 
acaactgaaa tcaaagccag attcataata attggctaca tggttgtaga atgtagggta 9540 
acacaacatc cagaattgaa cactcaaatt ggatgataga tggataatct ttagatacaa 9600 
gagaattggt tctcttccat tattaacgaa aataaagaaa aaaagtttag cataaaagtt 9660 
tgaaactcaa cataacattt tgaacttgac tccttcatag gagtgacatg aactgacgaa 9720 
tcacaaccga ttacttgttt gagtcatctt ccgctttctc caccttcgaa atgaatgtga 9780 
ccggtttctt cgggtgctca tttacggtca agtgtaaaac atctggtctc gacgagct 9838 

<210> 58 
<211> 14184 
<212> DNA 

<213> KQnstliche Sequenz 
<220> 

<223> Beschreibimg der kOnstliciien Sequenz: Esqjression 
vector pSUNl-codA-RNAi-At - Act • *2-At . Als-R-ocsT 

<400> 58 

ctgcttggta ataattgtca ttagattgtt tttatgcata gatgcactcg aaatcagcca 60 
attttagaca agtatcaaac ggatgttaat tcagtacatt aaagacgtcc gcaatgtgtt 120 
attaagttgt ctaagcgtca atttgtttac accacaatat atcctgccac cagccagcca 180 
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acagctcccc gaccggcagc tcggcacaaa atcaccacgc gttaccacca cgccggccgg 240 
ScgLtggtg ?tgaccgtgt tcgccggcat tgccgagttc gagcgttccc taatcatcga 300 
ccScacccgg agcgggcgcg aggccgccaa ggcccgaggc gtgaagtttg gcccccgccc 360 
taLctcaS? ccggcacaga tcgcgcacgc ccgcgagctg atcgaccagg J-JJ-J^- ^^0 
cgtgaaagag gcggctgcac tgcttggcgt gcatcgctcg accctgtacc gcgcacttga 480 
gSSgcSaS Saagtgacgc ccaccgaggc caggcggcgc ggtgccttcc gtgaggacgc 540 
I??gi?cSaS gccgacgccc tggcggccgc cgagaatgaa cgccaagagg ^00 
aaaLgcLc aggacggcca ggacgaaccg tttttcatta ccgaagagat cgaggcggag 660 
atgatcgcgg ccgggtacgt gttcgagccg cccgcgcacg tctcaaccgt ^cggctgcat 720 
gaaatcStS ccggtttgtc tgatgccaag ctggcggcct ggccggccag cttggccgct 780 
gaagaaacSS agcgccgccg tctaaaaagg tgatgtgtat ttgagtaaaa cagcttgcgt 840 
cSJcggtcJ c?gcgtatat gatgcgatga gtaaataaac aaatacgcaa ggg^aacgca 900 
?gaSgg?ta? cgctgtactt aaccagaaag gcgggtcagg caagacgacc atcgcaaccc 960 
aJcSScccg cjccctgcaa ctcgccgggg ccgatgttct gttagtcgat tccgatcccc 1020 
agggclgtg? cJgcgattgg gcggccgtgc gggaagatca accgctaacc J^^gtcggca 1080 
tcglccgccc gacgattgac cgcgacgtga aggccatcgg ccggcgcgac ttcgtagtga 1140 
tcSacgSagc gccccaggcg gcggacttgg ctgtgtccgc gatcaaggca g^^^^^^cg 1200 
tgctgattcc ggtgcagcca agcccttacg acatatgggc caccgccgac ctggtggagc 1260 
Sgt?aagca S^gLttgag gtcacggatg gaaggctaca agcggccttt ^tcgtgtcgc 1320 
gSgcgatcaa aggcacgcgc atcggcggtg aggttgccga ggcgctggcc gggtacgagc 1380 
?g?cSt?ct tSagtc?cgt atcacgcagc gcgtgagcta cccaggcact ^ccgccgccg 1440 
gcacaaccgt tcttgaatca gaacccgagg gcgacgctgc ccgcgaggtc caggcgctgg 1500 
Scgc?SaaSt taaa?caaaa ctcatttgag ttaatgaggt aaagagaaaa tgagcaaaag 1560 
cSJaaScacg ctaagtgccg gccgtccgag cgcacgcagc agcaaggctg caacgttggc 1620 
cagcctggcS gacacgccag ccatgaagcg ggtcaacttt cagttgccgg cggaggatca 1680 
caLaagctg aagatgtacg cggtacgcca aggcaagacc attaccgagc tg<=t^t^tga 1740 
atacatcgcg cagctaccag agtaaatgag caaatgaata aatgagtaga t^-^ttttag 1800 
Sggctaaagg aggcggcatg gaaaatcaag aacaaccagg caccgacgcc gtggaatgcc 1860 
cSatgStS aSaEgggc ggttggccag gcgtaagcgg ctgggttgtc tjccggccct 1920 
gcaatgScac tggaaccccc aagcccgagg aatcggcgtg agcggtcgca aaccatccgg 1980 
Sccgg?Scaa atcggcgcgg cgctgggtga tgacctggtg gagaagttga aggccgcgca 2040 
ggcScccag cggcLSgca tcgaggcaga agcacgcccc ggtgaatcgt ^srcaagcggc 2100 
Jgctgatcga atccgcaaag aatcccggca accgccggca gccggtgcgc cgtcgattag 2160 
gaagScgcSc aaggjcgacg agcaaccaga ttttttcgtt ccgatgctct atgacgtggg 2220 
?acccgcgat agtcgcagca tcatggacgt ggccgttttc cgtctgtcga -J-J^gaccg 2280 
acgagctggc gaggtgatcc gctacgagct tccagacggg cacgtagagg tttccgcagg 2340 
gccggccggc atggccagtg tgtgggatta cgacctggta ctgatggcgg tttcccatct 2400 
Lccgaatcc atgaaccgat accgggaagg gaagggagac aagcccggcc g<=9tgttccg 2460 
tccacacgtt gcggacgtac tcaagttctg ccggcgagcc sratggcggaa ^gcagaaaga 2520 
caacctggta gaaacctgca ttcggttaaa caccacgcac gttgccatgc agcgtacgaa 2580 
gaaggc?2; LcggccScc tggtgacggt atccgagggt gaagccttga "agccgcta 2640 
caagatcgta aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc tagctgattg 2700 
gItJtacSgc gagaLacag aaggcaagaa cccggacgtg ctgacggttc ^ccccgatta 2760 
ctt?ttga?c gatcccggca tcggccgttt tctctaccgc ctggcacgcc J^J^^J^^^J ^820 
caaggcagaa gccagatggt tgttcaagac gatctacgaa cgcagtggca ^cgccggaga 2880 
gttclagaag ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc tgccggagta 2940 
SgatttSaaS gaggJggcgg ggcaggctgg cccgatccta gtcatgcgct ^ccgcaacct 3000 
gStcgagggc gaagcatccg ccggttccta atgtacggag cagatgctag J^caaattgc 3060 
cctagcaggg gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt ^cattgggaa 3120 
cccaaagccg tacattggga accggaaccc gtacattggg aacccaaagc ^J^acattgg 3180 
gaaccggtca cacatgtaag tgactgatat aaaagagaaa aaaggcgatt tttccgccta 3240 
Lactc?tta aaacttatta aaactcttaa aacccgcctg gcctgtgcat ^actgtctgg 3300 
ccagcgcaca gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc J^tccctacg 3360 
ccccgccgct tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg ctggcctacg 3420 
gScaggcLt ctacSgSc gcggacaagc cgcgccgtcg ccactcgacc ^-ggcgccc 3480 
acatcaaggc accctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tjacacatgc 3540 
agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc 3600 
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agggcgcgtc agcgggtgtt ggcgggtgtc 
atagcggagt gtatactggc ttaactatgc 
ccatatgcgg tgtgaaatac cgcacagatg 
ttccgcttcc tcgctcactg actcgctgcg 
agctcactca aaggcggtaa tacggttatc 
catgtgagca aaaggccagc aaaaggccag 
tttccatagg ctccgccccc ctgacgagca 
gcgaaacccg acaggactat aaagatacca 
ctctcctgtt ccgaccctgc cgcttaccgg 
cgtggcgctt tctcatagct cacgctgtag 
caagctgggc tgtgtgcacg aaccccccgt 
ctatcgtctt gagtccaacc cggtaagaca 
taacaggatt agcagagcga ggtatgtagg 
taactacggc tacactagaa ggacagtatt 
cttcggaaaa agagttggta gctcttgatc 
tttttttgtt tgcaagcagc agattacgcg 
gatcttttct acggggtctg acgctcagtg 
catgcatgat atatctccca atttgtgtag 
agcagacttg acctgatagt ttggctgtga 
gagttaagcc gcgccgcgaa gcggcgtcgg 
gccgactacc ttggtgatct cgcctttcac 
gcgcgaggcc aagcgatctt cttcttgtcc 
gggctgatac tgggccggca ggcgctccat 
gattttgccg gttactgcgc tgtaccaaat 
atcgccagcc cagtcgggcg gcgagttcca 
tagatcctgt tcaggaaccg gatcaaagag 
gctatgttct cttgcttttg tcagcaagat 
gaagatacct gcaagaatgt cattgcgctg 
tggataacgc cacggaatga tgtcgtcgtg 
aatctcgctc tctccagggg aagccgaagt 
cgttgtttca tcaagcctta cggtcaccgt 
caggccgcca tccactgcgg agccgtacaa 
gcgctcgatg acgccaacta cctctgatag 
ccccatgatg tttaactttg ttttagggcg 
ccataacatc aaacatcgac ccacggcgta 
agactgtacc ccaaaaaaac agtcataaca 
acatacaaat ggacgaacgg ataaaccttt 
ataaacgctc ttttctctta ggtttacccg 
aaactgaagg cgggaaacga caatcagatc 
ccaagcttgc atgcctgcag gtcgactcta 
aggtacccat cgcgatcccc gtcaccggtg 
ttttatcttt agagttaaga actctttcgt 
tggtcataga cctattcatg gctctgatac 
tttcttaaat tgataagggg ttattagggg 
gcgtatagta taagtatagt agcgtacctc 
gggcctgcaa ccttatcctt ccttgtcttc 
aaaccaaacc tacgggggag tcaacgtaac 
gcctcctgcc taagcggtac ttctagcttc 
ctcgtgtctg gtttatattc acgacaaaga 
agtactggat tttggtttta ggaattagaa 
aaatacatac taagggtttc ttatatgctc 
aatttccctt atcgggaaac tactcacaca 
tttgtagaga gagactggtg atttcagcgt 
aataacgctt tacaaacaat tattaacgcc 
attcatctgc aggacggaaa aatcagcgcc 
actgaaaaca gcctggatgc cgaacaaggt 
attcacctgg acaccacgca aaccgccgga 



ggggcgcagc catgacccag tcacgtagcg 3660 
ggcatcagag cagattgtac tgagagtgca 3720 
cgtaaggaga aaataccgca tcaggcgctc 3780 
ctcggtcgtt cggctgcggc gagcggtatc 3 840 
cacagaatca ggggataacg caggaaagaa 3900 
gaaccgtaaa aaggccgcgt tgctggcgtt 3960 
tcacaaaaat cgacgctcaa gtcagaggtg 4020 
ggcgtttccc cctggaagct ccctcgtgcg 4080 
atacctgtcc gcctttctcc cttcgggaag 4140 
gtatctcagt tcggtgtagg tcgttcgctc 4200 
tcagcccgac cgctgcgcct tatccggtaa 4260 
cgacttatcg ccactggcag cagccactgg 4320 
cggtgctaca gagttcttga agtggtggcc 4380 
tggtatctgc gctctgctga agccagttac 4440 
cggcaaacaa accaccgctg gtagcggtgg 4500 
cagaaaaaaa ggatctcaag aagatccttt 4560 
gaacgaaaac tcacgttaag ggattttggt 4620 
ggcttattat gcacgcttaa aaataataaa 4680 
gcaattatgt gcttagtgca tctaacgctt 4740 
cttgaacgaa tttctagcta gacattattt 4800 
gtagtggaca aattcttcca actgatctgc 4860 
aagataagcc tgtctagctt caagtatgac 4920 
tgcccagtcg gcagcgacat ccttcggcgc 4980 
gcgggacaac gtaagcacta catttcgctc 5040 
tagcgttaag gtttcattta gcgcctcaaa 5100 
ttcctccgcc gctggaccta ccaaggcaac 5160 
agccagatca atgtcgatcg tggctggctc 5220 
ccattctcca aattgcagtt cgcgcttagc 5280 
cacaacaatg gtgacttcta cagcgcggag 5340 
ttccaaaagg tcgttgatca aagctcgccg 5400 
aaccagcaaa tcaatatcac tgtgtggctt 5460 
atgtacggcc agcaacgtcg gttcgagatg 5520 
ttgagtcgat acttcggcga tcaccgcttc 5580 
actgccctgc tgcgtaacat cgttgctgct 5 640 
acgcgcttgc tgcttggatg cccgaggcat 5700 
agccatgaaa accgccactg cgttccatgg 5760 
tcacgccctt ttaaatatcc gattattcta 5820 
ccaatatatc ctgtcaaaca ctgatagttt 5880 
tagtaggaaa cagctatgac catgattacg 5940 
gactagtgga tccgatatcg cccgggctcg 6000 
tgagggaact agttttgatc ttgaaagatc 6060 
attttggtga ggttttatcc tcttgagttt 6120 
caatttttaa gcgggggctt atgcggatta 6180 
gtatagggta taaatacaag cattccctta 6240 
tatcaaattt ccatcttctt accttgcaca 6300 
ctccttcctt ccgtccactt catcatattt 63 60 
caaccctgcc ttagcatctt ttccctaacg 6420 
gaacggcgtc tgggctccag gtttagtcgt 6480 
tctataggga ctttaggaga tctggatttt 6540 
attttattga tagaagtatt ttacaaatac 6600 
aacacatgag cgaaacccta taagaaccct 6660 
ttatttatgg agaaaataga gagagataga 672 0 
accgaattcg attttcggct aacagtgtcg 6780 
cggttaccag gcgaagaggg gctgtggcag 6840 
attgatgcgc aatccggcgt gatgcccata 6900 
ttagttatac cgccgtttgt ggagccacat 69 60 
caaccgaact ggaatcagtc cggcacgctg 7020 
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tttgaaggca 
caacgcgcat 
catgtcgatg 
gaagtcgcgc 
gatccggtga 
aaatatacac 
gaaaaaaata 
aaaggtagaa 
gatttgcaga 
agttagcgtt 
ctgccatttc 
gcgctcggcc 
tccggcggtt 
accttgttcg 
ggcgctgatt 
ggcgttaata 
aggtcgactc 
cactcagaga 
gtttattttc 
tgggactagc 
gttcacatca 
agccgatgct 
ggtggtttac 
taccaaataa 
atttattctt 
gtaataatat 
gtcgtacgat 
attttttttt 
cataaataaa 
atgtgagttt 
ttatctcaga 
caaatatctt 
cctacaagag 
attagttcgc 
tttcattgca 
tcttacttgc 
gtcaatgaaa 
ctgattgtga 
tatacgtaat 
tttttaagaa 
gtaacttaat 
aactgaaatc 
acaacatcca 
gaattggttc 
aaactcaaca 
acaaccgatt 
ggtttcttcg 
accgaatcga 
taccgagctc 
aaaatttaga 
taggttatca 
atgtaattgg 
aaacaactat 
tgacgagttc 
atatgatgaa 
ttctttcacg 
tgaattgtat 



ttgaacgctg 
ggcaaacgct 
tttcggatgc 
cgtggattga 
tacctgcaca 
acttataaac 
tttgaaatat 
gcagaaactt 
tcaatccacg 
gcatccgaaa 
agcgtttgcc 
cagcgttcaa 
tgcgtggtgt 
gcatccaggc 
tttccgtcct 
attgtttgta 
tagaggatcc 
cttgagagaa 
ctattggaga 
ccacgtggtt 
aacctactaa 
ttatgtctga 
aaagtatttg 
aaaacaaata 
ttatggattc 
atactatgtt 
tctacctaat 
tggtttgtct 
atttgacgta 
ggctcctatt 
gaaactggat 
tggatttact 
aaatcaaaat 
atcaagaaaa 
gctttcagat 
aggaactcaa 
cgaaatagtc 
cagccatcca 
ggtttagcat 
aaataaatta 
tattaaacat 
aaagccagat 
gaattgaaca 
tcttccatta 
taacattttg 
acttgtttga 
ggtgctcatt 
agtacaactt 
gaattcactg 
acgaacttaa 
ttatgtaaga 
tatctcaact 
tttttatgta 
ggatgtagta 
acattgtatc 
gtctgaatta 
gaaatctaat 



ggccgagcgc 
gaaatggcag 
aacgctaact 
tctgcaaatc 
tcaacaaatt 
tacagaaaag 
tatattacta 
acgtagtcga 
gcgcgacttc 
catcgacatg 
atgcgcgttg 
tgccttcaaa 
ccaggtgaat 
tgttttcagt 
gcagatgaat 
aagcgttatt 
ccgatccact 
gcaatatata 
cggtaacgaa 
tcttttctct 
taattgagaa 
atataaaaaa 
gacacaataa 
aaaaacttaa 
cttaaatcca 
atagatatgt 
aatattgaac 
tagctgtatt 
tagatttttt 
taatcttagg 
taaataaact 
attattggcg 
ttttgaatta 
ccaaacccca 
aaaagaaaaa 
attccacttt 
tttttatgca 
tatatatagg 
agcttctatt 
atatatgtat 
tctaaatgca 
tcataataat 
ctcaaattgg 
ttaacgaaaa 
aacttgactc 
gtcatcttcc 
tacggtcaag 
agctcttgct 
gccgtcgttt 
ttatgatctc 
aagttttgac 
caacattata 
tgcaagagtc 
gtagccatta 
ttattgtata 
attatgatac 
tgaacaagcc 
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aaagcgttat 
attgccaacg 
gcgctgaaag 
gtcgccttcc 
ttggtcatat 
caattgctat 
ctaattaatg 
cgacaaaatc 
ctgcttcact 
ggtacgcaca 
tttcacatcg 
cagcgtgccg 
atgtggctcc 
tatgggcatc 
ctgccacagc 
cgacactgtt 
cgagtctttg 
gacttttttt 
gatcgaacct 
gcattgattt 
gaaaaataaa 
gaagtgaaaa 
atccaaacga 
aagaatttat 
tatttgatgc 
ttctaattcg 
ggaattgatg 
tcattaaata 
aaatccattt 
atgggttaat 
aaaaaataga 
aaaagaaagt 
acatggattg 
attaataatc 
aacacacact 
gccacttttc 
aacactgttt 
gaatgtaaaa 
ttcgttgtca 
attcttggaa 
aatatgcaaa 
tggctacatg 
atgatagatg 
taaagaaaaa 
cttcatagga 
gctttctcca 
tgtaaaacat 
acatcaccaa 
tacaacgact 
aaatacattg 
gaatatggca 
cttataccaa 
agcatatgta 
tttaatgtac 
aatatccata 
aattctaata 
aaccacgacg 
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taacccatga 
gcattcagca 
caatgctgga 
ctcaggaagg 
attagaaaag 
atactacatt 
ataattatta 
ccgtcctgag 
tccagcattg 
tgctgaatgc 
tcatgggtta 
gactgattcc 
acaaacggcg 
acgccggatt 
ccctcttcgc 
agccaagctt 
ttttttactt 
tgtttttttt 
gtggtggaaa 
gtttttgttt 
atctattgat 
ccccgtttaa 
aataaaacaa 
tccatttttt 
attttgattc 
tattaaccta 
ttttggacca 
taaatttaaa 
tatgttattt 
actaagtttt 
tcaatgtgtt 
ctcatatagt 
tatagtttct 
aaacgggctt 
caagtctttt 
tttacaaata 
gtcttttttc 
caacaacatg 
atattagtca 
ctaatgtatg 
gaaaaaaaag 
gttgtagaat 
gataatcttt 
aagtttagca 
gtgacatgaa 
ccttcgaaat 
ctggtctcga 
gatcttgatg 
cagcacgcgt 
atacatatct 
cgacaaaatg 
acattagtta 
taattgattc 
atactaatcg 
aacacatcat 
gaaaacgaat 
acgactaacg 



cgatgtgaaa 
tgtgcgtacc 
agtgaagcag 
gattttgtcg 
ttataaatta 
cttttatttt 
tatatatatc 
ggaaggcgac 
ctttcagcgc 
cgttggcaat 
ataacgcttt 
agttcggttg 
gtataactaa 
gcgcatcaat 
ctggtaaccg 
gcatgcctgc 
tggttcatga 
ttgtggtcac 
tgaaacmagg 
tttytgtaaa 
tgattaaacc 
gaattacaac 
aatggagaac 
ttcccgtaga 
ctcataatag 
cctttttttg 
cttagaaagt 
taagaaatgt 
aatatttgaa 
ccttaatgaa 
ttggtccggt 
aaatcatatt 
tatataacca 
ggtaggaata 
atttcatctt 
aacacaaatt 
gatcacgttt 
tgaagtcaca 
ttccaaaaca 
tggaaataca 
aaaagaacac 
gtagggtaac 
agatacaaga 
taaaagtttg 
ctgacgaatc 
gaatgtgacc 
gtaatgtcca 

ggggatcggg 
tggtttcgac 
catctagatc 
gctagactcg 
gacaaaattt 
agaatcgttt 
tgaatagtga 
gaaagacact 
taaattacgt 
ttgcctggat 



7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240- 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
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tgactcggtt taagttaacc actaaaaaaa 
aggtcacagt catgaagcca tcaaagcaaa 
tagtttaaaa attagttaac acgagggaaa 
ttacctgtgg tcgaaatgat tcgtgtctgt 
aataaagttg taagagataa acccgcctat 
aattgtctcg ttgtcctcct cactttcatc 
agaagaacaa ggaagaagac taagagagaa 
cgttttgaat cttcctcaat ctcatcttct 
tttctggatc tactttattt gctggatctc 
ggaattcgtt taatttggat ctgtgaacct 
atctaagttg accgatcagt tagctcgatt 
ggagagatcc atgttcatgt tacctgggaa 
ctgttgaagt tagattgaat ctgaacactg 
aaggttagat gaagtttgtg tatagattct 
ttgaacagaa agctatttct gattcaatca 
gtgtgtttgc agctcataaa aaaaacgcga 
aacaacaaca tcttcttcga tctccttctc 
accattacca atctccagat tctccctccc 
ctcctcccgc cgccgcggta tcaaatccag 
cacaaccacc aatgtcacaa ccactccctc 
catctcccga ttcgctccag atcaaccccg 
agaacgtcaa ggcgtagaaa ccgtattcgc 
ccaagcctta acccgctctt cctcaatccg 
tgtattcgca gcagaaggat acgctcgatc 
ttcaggtccc ggagctacaa atctcgttag 
tcctcttgta gcaatcacag gacaagtccc 
agagactccg attgttgagg taacgcgttc 
tgttgaagat atccctagga ttattgagga 
tggacctgtt ttggttgatg ttcctaaaga 
ggaacaggct atgagattac ctggttatat 
tcatttggag cagattgtta ggttgatttc 
tggtggttgt ttgaattcta gcgatgaatt 
tgttgcgagt acgttgatgg ggctgggatc 
tatgcttgga atgcatggga ctgtgtatgc 
gttggcgttt ggggtaaggt ttgatgatcg 
tagggctaag attgttcata ttgatattga 
tcatgtgtct gtgtgtggtg atgttaagct 
gaaccgagcg gaggagctta agcttgattt 
gaaacagaag tttccgttga gctttaagac 
gattaaggtc cttgatgagt tgactgatgg 
acatcaaatg tgggcggcgc agttctacaa 
aggaggcctt ggagctatgg gatttggact 
ccctgatgcg atagttgtgg atattgacgg 
gctagccact attcgtgtag agaatcttcc 
tcttggcatg gttatgcaat gggaagatcg 
tctcggggat ccggctcagg aggacgagat 
ttgcgggatt ccagcggcga gggtgacaaa 
aatgctggat acaccaggac cttacctgtt 
gttgccgatg atcccgaatg gtggcacttt 
gattaaatac tgagagatga aaccggcctg 
gctttggtcg atcgacggga tcgatcctgc 
gcatgatatt tgctttcaat tctgttgtgc 
cagatcctta ccgccggttt cggttcattc 
ttttatgaat aatattctcc gttcaattta 
tattaaaatg aaaacaatat attgtgctga 
gccacaataa caaacaattg cgttttatta 
aaccggtcaa acctaaaaga ctgattacat 



cggagctgtc atgtaacacg cggatcgagc 10500 
agaactaatc caagggctga gatgattaat 10560 
aggctgtctg acagccaggt cacgttatct 10620 
cgattttaat tatttttttg aaaggccgaa 10680 
ataaattcat atattttcct ctccgctttg 10740 
agccgttttg aatctccggc gacttgacag 10800 
agtaagagat aatccaggag attcattctc 10860 
tccgctcttt ctttccaagg taataggaac 1092 0 
gatcttgttt tctcaatttc cttgagatct 10980 
ccactaaatc ttttggtttt actagaatcg 11040 
atagctacca gaatttggct tgaccttgat 11100 
atgatttgta tatgtgaatt gaaatctgaa 11160 
tcaatgttag attgaatctg aacactgttt 11220 
tcgaaacttt aggatttgta gtgtcgtacg 11280 
gggtttattt gactgtattg aactcttttt 11340 
acctgcaggc atggcggcgg caacaacaac 11400 
caccaaacca tctccttcct cctccaaatc 11460 
attctcccta aaccccaaca aatcatcctc 11520 
ctctccctcc tccatctccg ccgtgctcaa 11580 
tccaaccaaa cctaccaaac ccgaaacatt 11640 
caaaggcgct gatatcctcg tcgaagcttt 11700 
ttaccctgga ggtgcatcaa tggagattca 11760 
taacgtcctt cctcgtcacg aacaaggagg 11820 
ctcaggtaaa ccaggtatct gtatagccac 11880 
cggattagcc gatgcgttgt tagatagtgt 11940 
tcgtcgtatg attggtacag atgcgtttca 12000 
gattacgaag cataactatc ttgtgatgga 12060 
agctttcttt ttagctactt ctggtagacc 12120 
tattcaacaa cagcttgcga ttcctaattg 12180 
gtctaggatg cctaaacctc cggaagattc 12240 
tgagtctaag aagcctgtgt tgtatgttgg 12300 
gggtaggttt gttgagctta cggggatccc 12360 
ttatccttgt gatgatgagt tgtcgttaca 12420 
aaattacgct gtggagcata gtgatttgtt 12480 
tgtcacgggt aagcttgagg cttttgctag 12540 
ctcggctgag attgggaaga ataagactcc 12600 
ggctttgcaa gggatgaata aggttcttga 12660 
tggagtttgg aggaatgagt tgaacgtaca 12720 
gtttggggaa gctattcctc cacagtatgc 12780 
aaaagccata ataagtactg gtgtcgggca 12840 
ttacaagaaa ccaaggcagt ggctatcatc 12900 
tcctgctgcg attggagcgt ctgttgctaa 12960 
agatggaagc tttataatga atgtgcaaga 1302 0 
agtgaaggta cttttattaa acaaccagca 13080 
gttctacaaa gctaaccgag ctcacacatt 13140 
attcccgaac atgttgctgt ttgcagcagc 13200 
gaaagcagat ctccgagaag ctattcagac 132 60 
ggatgtgatt tgtccgcacc aagaacatgt 13320 
caacgatgtc ataacggaag gagatggccg 13380 
gccggcccgg agtggggagg cacgatggcc 13440 
tttaatgaga tatgcgagac gcctatgatc 13500 
acgttgtaaa aaacctgagc atgtgtagct 13560 
taatgaatat atcacccgtt actatcgtat 13620 
ctgattgtac cctactactt atatgtacaa 13680 
ataggtttat agcgacatct atgatagagc 13740 
ttacaaatcc aattttaaaa aaagcggcag 13800 
aaatcttatt caaatttcaa aaggccccag 13860 
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gggctagtat ctacgacaca ccgagcggcg aactaataac gttcactgaa g^^JJ^tccg 13920 
J??ccc?gcc ggcgcgcatg ggtgagattc cttgaagttg agtattggcc ^tccgctcta 13980 
ccgaaagtta cgggcaccat tcaacccggt ccagcacggc ggccgggtaa ccgacttgct 14040 
gc?ccgagaa t?Sgcagca tttttttggt gtatgtgggc cccaaatgaa gtgcaggtca 14100 
SccSgLa gtga?gacaa atcgttgggc gggtccaggg cgaattttgc gacaacatgt 14160 
cgaggctcag caggatgggc ccag 

<210> 59 
<211> 1011 
<212> DNA 
<213> Zea mays 

<220> 

<221> CDS 

<222> (1)..(981) 

<223> coding for 5- methlythioribose kinase 

aca°cga%ca etc etc tec tct cet etc gcc ggc gca teg ccc gac tgt 48 
Sg La Leu Leu Ser Ser Pro Leu Ala Gly Ala Ser Pro Asp Cys 
1 5 10 

cag tea gcc tea gcc atg gee gcg gag gag gag cag ggc ttc cgc ccg 
III III Jla ser Ala Met Ala Ala Glu Glu Glu Gin Gly Phe Arg Pro 

20 25 30 

ctg gac gag teg tec ctg etc gee tac ate aag gee acg ecg gcg etc 
LeS Sp Slu ser Ser Leu Leu Ala Tyr He Lys Ala Thr Pro Ala Leu 

35 40 45 

gcc tec cgc etc ggc ggc ggt ggc agt eta gac tec ate gag ate aag 
Ala ser Arg Leu Gly Gly Gly Gly Ser Leu Asp Ser He Glu He Lys 

50 55 60 

aaa gtc ggc gac ggc aac etc aac ttc gtc tae ate gtg cag tee gag 
£u ?al lly Lp Sy Asn Leu Asn Phe Val Tyr He Val Gin Ser Glu 

65 70 75 

gcc ggc gcc ate gtc gtc aag cag gcg etc ecg tac gtg cgc tge gtg 
AlJ G?y Ala He Val Val Lys Gin Ala Leu Pro Tyr Val Arg Cys Val 
85 90 3= 



96 



144 



192 



240 



288 



aaa gat teg tgg ccc atg acg egg gag cgc gee tae ttc gag gcc tec 
III J^p Se? tS Pro Met -Ehr Arg Glu Arg Ala Tyr Phe Glu Ala Ser 



100 



105 110 



acg ctg egg gag cac ggc cgc ctg tge ceg gag cae acc ccc gag gtg 
?S III Sg 111 His Gly Arg Leu Cys Pro Glu His Thr Pro Glu Val 

120 125 
tac cac ttc gac egg ace ttg teg ctg atg ggg atg cgc tae ate gag 
^ Ss Phe Lp A?g Thr Leu Ser Leu Met Gly Met Arg Tyr He Glu 

130 135 140 

ccc ccg cae ate ate etc cgc aag ggc etc gtc gcc ggt gtc gag tac 
P?o III His He He Leu Arg Lys Gly Leu Val Ala Gly Val Glu Tyr 
145 150 155 

ceg ctg etc gee gac cae atg tec gat tac atg gcc aag acg etc ttc 
Tro Leu Leu La Lp His Met Ser Asp Tyr Met Ala Lys Thr Leu Phe 

165 170 175 

ttc acc tec etc etc tat aac aat ace acg gat cat aag aac gga gtt 
Phe Thr ser Leu Leu Tyr Asn Asn Thr Thr Asp Hxs Lys Asn Gly Val 
180 185 



336 



384 



432 



480 



528 



576 
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get aag tac tct gcg aac gtg gag atg tgt agg etc acg gag caa gtt 624 
Ala Lys Tyr Ser Ala Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val 
195 200 205 

gtg ttc teg gac eea tac cgt gtt tec aaa ttt aat egg tgg ace teg 672 
Val Phe Ser Asp Pro Tyr Arg Val Ser Lys Phe Asn Arg Trp Thr Ser 
210 215 220 

eet tat etc gac aaa gat get gag gea gtt cgc gag gat gat gag etc 720 
Pro Tyr Leu Asp Lys Asp Ala Glu Ala Val Arg Glu Asp Asp Glu Leu 
225 230 235 240 

aag ttg gaa gta get ggg etg aaa teg atg ttt ate gag aga get caa 768 
Lys Leu Glu Val Ala Gly Leu Lys Ser Met Phe He Glu Arg Ala Gin 
245 250 255 

get etg att cat gga gat etc cae act ggt tct ate atg gtg ace gaa 816 
Ala Leu He His Gly Asp Leu His Thr Gly Ser He Met Val Thr Glu 
260 265 270 

gtt caa etc aag tea ttg ate eag aat ttg ggt tct atg ggg eea atg 864 
Val Gin Leu Lys Ser Leu He Gin Asn Leu Gly Ser Met Gly Pro Met 
275 280 285 

ggg ttt gat att ggg age ctt cct tgg aaa eet gat ttt ggg eat act 912 
Gly Phe Asp He Gly Ser Leu Pro Trp Lys Pro Asp Phe Gly His Thr 
290 295 300 

atg eac aga atg ggc atg etg ate aag cga atg ate gta agg ctt aca 960 
Met His Arg Met Gly Met Leu He Lys Arg Met He Val Arg Leu Thr 
305 310 315 320 

aga atg gat ctt gaa gac aat tgaagagtcg tggaatttgt tecacaaaaa 1011 
Arg Met Asp Leu Glu Asp Asn 
325 

<210> 60 
<211> 327 
<212> PRT 
<213> Zea mays 

<400> 60 

Ala Arg Ala Leu Leu Ser Ser Pro Leu Ala Gly Ala Ser Pro Asp Cys 
15 10 15 

Gin Ser Ala Ser Ala Met Ala Ala Glu Glu Glu Gin Gly Phe Arg Pro 
20 25 30 

Leu Asp Glu Ser Ser Leu Leu Ala Tyr He Lys Ala Thr Pro Ala Leu 
35 40 45 

Ala Ser Arg Leu Gly Gly Gly Gly Ser Leu Asp Ser He Glu He Lys 
50 55 60 

Glu Val Gly Asp Gly Asn Leu Asn Phe Val Tyr He Val Gin Ser Glu 
65 70 75 80 

Ala Gly Ala He Val Val Lys Gin Ala Leu Pro Tyr Val Arg Cys Val 
85 90 95 

Gly Asp Ser Trp Pro Met Thr Arg Glu Arg Ala Tyr Phe Glu Ala Ser 
100 105 110 

Thr Leu Arg Glu His Gly Arg Leu Cys Pro Glu His Thr Pro Glu Val 
115 120 125 

Tyr His Phe Asp Arg Thr Leu Ser Leu Met Gly Met Arg Tyr He Glu 
130 135 140 
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Pro Pro His lie He Leu Arg Lys Gly Leu Val Ala Gly Val Glu Tyr 

145 150 155 160 

Pro Leu Leu Ala Asp His Met Ser Asp Tyr Met Ala Lys Thr Leu Phe 
165 170 175 

Phe Thr Ser Leu Leu Tyr Asn Asn Thr Thr Asp His Lys Asn Gly Val 
180 185 190 

Ala Lys Tyr Ser Ala Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val 
195 200 205 

Val Phe Ser Asp Pro Tyr Arg Val Ser Lys Phe Asn Arg Trp Thr Ser 

210 215 220 

Pro Tyr Leu Asp Lys Asp Ala Glu Ala Val Arg Glu Asp Asp Glu Leu 
225 230 235 240 

Lys Leu Glu Val Ala Gly Leu Lys Ser Met Phe He Glu Arg Ala Gin 

245 250 255 

Ala Leu He His Gly Asp Leu His Thr Gly Ser He Met Val Thr Glu 
260 265 270 

Val Gin Leu Lys Ser Leu He Gin Asn Leu Gly Ser Met Gly Pro Met 
275 280 285 

Gly Phe Asp He Gly Ser Leu Pro Trp Lys Pro Asp Phe Gly His Thr 

290 295 300 

Met His Arg Met Gly Met Leu He Lys Arg Met He Val Arg Leu Thr 
305 310 315 320 

Arg Met Asp Leu Glu Asp Asn 
325 



<210> 61 
<211> 471 
<212> DNA 

<213> Brass ica napus 

<220> 

<221> CDS 

<222> (2) . . (469) 

<223> coding for 5- methlythioribose kinase 
<400> 61 

a ttt ccg ggt cga cga ttt cgt ggc aat etc aac ttc gtt ttc ate gtc 49 
Phe Pro Gly Arg Arg Phe Arg Gly Asn Leu Asn Phe Val Phe He Val 
15 10 15 

ate gga tec act ggc tea etc gtc ate aaa eag gcg ctt ccg tat ata 97 
He Gly Ser Thr Gly Ser Leu Val He Lys Gin Ala Leu Pro Tyr He 
20 25 30 

cgt tgt att ggg gag tct tgg cea atg aeg aaa gaa aga get tac ttt 145 
Arg Cys He Gly Glu Ser Trp Pro Met Thr Lys Glu Arg Ala Tyr Phe 

35 40 45 

gaa got aca act ctg aga aag cac gga get ttg tct cct gat eat gtt 193 
Glu Ala Thr Thr Leu Arg Lys His Gly Ala Leu Ser Pro Asp His Val 

50 55 60 

cct gaa gtc tac cat ttt gac agg acc atg get ttg att gga atg agg 241 
Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg 
65 70 75 80 
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tat ctg gag cct cct cac ate ate ete cgc aaa gga etc gtt get gga 289 

Tyr Leu Glu Pro Pro His lie lie Leu Arg Lys Gly Leu Val Ala Gly 
85 90 95 

ate eag tae eet ttc ctt gea gaa cae atg get gat tac atg gee aaa 337 
lie Gin Tyr Pro Phe Leu Ala Glu His Met Ala Asp Tyr Met Ala Lys 
100 105 110 

ace etc tte ttc act teg etc etc tat cat gat acc aca gag cac aaa 385 
Thr Leu Phe Plie Thr Ser Leu Leu Tyr His Asp Thr Thr Glu His Lys 
115 120 125 

aga gea gta acc gag ttt tgt ggt aat gtg gag tta tgc egg tta aeg 433 
Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu Leu Cys Arg Leu Thr 
130 135 140 

gag caa gta gtg ttc tct gac ccg tat aga gtt tct ag 471 
Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val Ser 
145 150 155 

<210> 62 
<211> 156 
<212> PRT 

<213> Brassica napus 
<400> 62 

Phe Pro Gly Arg Arg Phe Arg Gly Asn Leu Asn Phe Val Phe He Val 

15 10 15 

He Gly Ser Thr Gly Ser Leu Val lie Lys Gin Ala Leu Pro Tyr He 
20 25 30 

Arg cys He Gly Glu Ser Trp Pro Met Thr Lys Glu Arg Ala Tyr Phe 
35 40 45 

Glu Ala Thr Thr Leu Arg Lys His Gly Ala Leu Ser Pro Asp His Val 
50 55 60 

Pro Glu Val Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg 
65 70 75 80 

Tyr Leu Glu Pro Pro His He He Leu Arg Lys Gly Leu Val Ala Gly 
85 90 95 

He Gin Tyr Pro Phe Leu Ala Glu His Met Ala Asp Tyr Met Ala Lys 

100 105 110 

Thr Leu Phe Phe Thr Ser Leu Leu Tyr His Asp Thr Thr Glu His Lys 
115 120 125 

Arg Ala Val Thr Glu Phe Cys Gly Asn Val Glu Leu Cys Arg Leu Thr 
130 135 140 

Glu Gin Val Val Phe Ser Asp Pro Tyr Arg Val Ser 
145 150 155 



<210> 63 
<211> 415 
<212> DNA 

<213> Brassica napus 

<220> 

<221> CDS 

<222> (3) . . (413) 

<223> coding for 5- methlythioribose kinase 
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<400> 63 

gg gtc gac gat ttc gtg ctg aga gca aaa gag atg teg ttc gat gag 47 
Val Asp Asp Phe Val Leu Arg Ala Lys Glu Met Ser Phe Asp Glu 
15 10 15 

ttc aag ccg ttg aac gag aaa tct eta gta gag tac ata aag gca acg 95 
Phe Lys Pro Leu Asn Glu Lys Ser Leu Val Glu Tyr He Lys Ala Thr 

20 25 30 

cct gcc etc tec tec agg etc gga gac aag tac gat gat ctg gtc ate 143 
Pro Ala Leu Ser Ser Arg Leu Gly Asp Lys Tyr Asp Asp Leu Val He 

35 40 45 

aag gaa gtt gga gat ggc aat etc aac ttc gtt ttc ate gtt gtc gga 
Lys Glu val Gly Asp Gly Asn Leu Asn Phe Val Phe He Val Val Gly 
50 55 60 



191 



239 



287 



383 



415 



tec act ggc tea etc gtc ate aaa cag gcg ctt ccg tat ata cgt tgt 
Ser Thr Gly Ser Leu Val He Lys Gin Ala Leu Pro Tyr He Arg Cys 

65 70 75 

att gga gaa tea tgg cca atg acg aaa gaa aga get tac ttt gaa gca 
He Gly Glu Ser Tjrp Pro Met Thr Lys Glu Arg Ala Tyr Phe Glu Ala 
80 85 90 95 

aca act ctg aga aag cac ggt ggt ttg tct ccg gat cat gtt cct gaa 335 
Thr Thr Leu Arg Lys His Gly Gly Leu Ser Pro Asp His Val Pro Glu 

100 105 110 

gtc tac cat ttt gac aga ace atg get ttg att gga atg aga tac etc 
Val Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg Tyr Leu 
115 120 125 

gag cct cct cac ate ate etc cgc aaa gga ct 
Glu Pro Pro His He He Leu Arg Lys Gly 
130 135 

<210> 64 

<211> 137 
<212> PRT 

<213> Brassica napus 
<400> 64 

Val Asp Asp Phe Val Leu Arg Ala Lys Glu Met Ser Phe Asp Glu Phe 

15 10 15 

Lys Pro Leu Asn Glu Lys Ser Leu Val Glu Tyr He Lys Ala Thr Pro 
20 25 30 

Ala Leu Ser Ser Arg Leu Gly Asp Lys Tyr Asp Asp Leu Val He Lys 

35 40 45 

Glu Val Gly Asp Gly Asn Leu Asn Phe Val Phe He Val Val Gly Ser 

50 55 60 

'Thx Gly Ser Leu Val He Lys Gin Ala Leu Pro Tyr He Arg Cys He 
65 70 75 80 

Gly Glu Ser Trp Pro Met Thr Lys Glu Arg Ala Tyr Phe Glu Ala Thr 

85 90 95 

Thr Leu Arg Lys His Gly Gly Leu Ser Pro Asp His Val Pro Glu Val 

100 105 110 

Tyr His Phe Asp Arg Thr Met Ala Leu He Gly Met Arg Tyr Leu Glu 
115 120 125 

Pro Pro His He He Leu Arg Lys Gly 
130 135 
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<210> 65 

<211> 424 

<212> DNA 

<213> Oryza sativa 

<220> 

<221> CDS 

<222> (3) . . (422) 

<223> coding for 5- methlythioribose kinase 
<400> 65 

cc ctt etc tac aac tec aec act gat cae aag aaa gga gtt get cag 47 
Leu Leu Tyr Asn Ser Tbir Thr Asp His Lys Lys Gly Val Ala Gin 
15 10 15 

tac tgc gat aat gtg gag atg tgt agg etc aca gag caa gtc gtg ttc 95 
Tyr Cys Asp Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val Val Phe 

20 25 30 

tea gac cca tac atg etc gee aaa tac aat cgt tgc aca tea cec ttc 143 
Ser Asp Pro Tyr Met Leu Ala Lys Tyr Asn Arg Cys Thr Ser Pro Phe 
35 40 45 

eta gat aat gat get gea gcg gtt ega gag gat get gag ctt aaa ttg 191 
Leu Asp Asn Asp Ala Ala Ala Val Arg Glu Asp Ala Glu Leu Lys Leu 
50 55 60 

gag att get gaa ttg aaa tea atg ttt att gag aga gea cag get ctt 239 
Glu lie Ala Glu Leu Lys Ser Met Phe lie Glu Arg Ala Gin Ala Leu 
65 70 75 

ctt cat gga gat etc cae act ggt tec ate atg gtg aca cca gat tet 287 
Leu His Gly Asp Leu His Thr Gly Ser lie Met Val Thr Pro Asp Ser 
80 85 90 95 

act caa gtg att gat cca gaa ttt get ttc tat ggc cca atg ggt tac 335 
Thr Gin Val He Asp Pro Glu Phe Ala Phe Tyr Gly Pro Met Gly Tyr 
100 105 110 

gac att ggg gee ttc ctg ggg aac ttg att ttg gea tat ttt tea caa 383 
Asp He Gly Ala Phe Leu Gly Asn Leu He Leu Ala Tyr Phe Ser Gin 
115 120 125 

gat gga cae get gat caa gea aat gat cgt aag get tac aa 424 
Asp Gly His Ala Asp Gin Ala Asn Asp Arg Lys Ala Tyr 
130 135 140 

<210> 66 

<211> 140 

<212> PRT 

<213> Oryza sativa 

<400> 66 

Leu Leu Tyr Asn Ser Thr Thr Asp His Lys Lys Gly Val Ala Gin Tyr 
15 10 15 

Cys Asp Asn Val Glu Met Cys Arg Leu Thr Glu Gin Val Val Phe Ser 
20 25 30 

Asp Pro Tyr Met Leu Ala Lys Tyr Asn Arg Cys Thr Ser Pro Phe Leu 
35 40 45 

Asp Asn Asp Ala Ala Ala Val Arg Glu Asp Ala Glu Leu Lys Leu Glu 
50 55 60 
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He Ala Glu Leu Lys Ser Met Phe He Glu Arg Ala Gin Ala Leu Leu 

65 70 75 80 

His Gly Asp Leu His Thr Gly Ser He Met Val Thr Pro Asp Ser Thr 
85 90 95 

Gin Val He Asp Pro Glu Phe Ala Phe Tyx Gly Pro Met Gly Tyr Asp 

100 105 110 

He Gly Ala Phe Leu Gly Asn Leu He Leu Ala Tyr Phe Ser Gin Asp 
115 120 125 

Gly His Ala Asp Gin Ala Asn Asp Arg Lys Ala Tyr 
130 135 140 



47 



95 



<210> 67 
<211> 404 
<212> DNA 
<213> Glycine max 

<220> 
<221> CDS 
<222> (3) . . (404) 

<223> coding for 5- methlythioribose kinase 
<400> 67 

ta ate ccc gaa cat gtt cct gaa gtg tat cac ttt gac cgt acc atg 
He Pro Glu His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met 
15 10 15 

tct ttg ate ggt atg cgt tae ttg gag ccc cea cat ata ate etc ata 
Ser Leu He Gly Met Arg Tyr Leu Glu Pro Pro His He He Leu He 
20 25 30 

aaa ggg ttg att get ggg att gag tae cct ttt ttg get gaa cac atg 143 
Lys Gly Leu He Ala Gly He Glu Tyr Pro Phe Leu Ala Glu His Met 
35 40 45 

get gat ttc atg gcg aag aca etc tte ttc aeg tct etg ett ttc cgt 191 
Ala Asp Phe Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Phe Arg 

50 55 60 

tec act get gac cac aaa egg gac gtt gcc gaa ttt tgt ggg aat gtg 239 
Ser Thr Ala Asp His Lys Arg Asp Val Ala Glu Phe Cys Gly Asn Val 

65 70 75 

gag tta tgc agg etc act gaa eag gtc gtt ttc tct gac cct tat aaa 287 
Glu Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Lys 
80 85 90 95 

gtt tct caa tat aat cgt tgg act tee ccc tat ett gat cgt gat get 335 
Val Ser Gin Tyr Asn Arg Trp Thr Ser Pro Tyr Leu Asp Arg Asp Ala 
100 105 110 

gag get gtt egg gaa gac aat etg etg aag ett gaa gtt get gag etg 383 
Glu Ala Val Arg Glu Asp Asn Leu Leu Lys Leu Glu Val Ala Glu Leu 
115 120 125 



aaa tee aag tte att gag age 
Lys Ser Lys Phe He Glu Ser 
130 

<210> 68 

<211> 134 

<212> PRT 

<213> Glycine max 



404 
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<400> 68 

lie Pro Glu His Val Pro Glu Val Tyr His Phe Asp Arg Thr Met Ser 
15 10 15 

Leu lie Gly Met Arg Tyr Leu Glu Pro Pro His lie He Leu He Lys 
20 25 30 

Gly Leu He Ala Gly He Glu Tyr Pro Phe Leu Ala Glu His Met Ala 
35 40 45 

Asp Phe Met Ala Lys Thr Leu Phe Phe Thr Ser Leu Leu Phe Arg Ser 
50 55 60 

Thr Ala Asp His Lys Arg Asp Val Ala Glu Phe Cys Gly Asn Val Glu 
65 70 75 80 

Leu Cys Arg Leu Thr Glu Gin Val Val Phe Ser Asp Pro Tyr Lys Val 
85 90 95 

Ser Gin Tyr Asn Arg Trp Thr Ser Pro Tyr Leu Asp Arg Asp Ala Glu 
100 105 110 

Ala Val Arg Glu Asp Asn Leu Leu Lys Leu Glu Val Ala Glu Leu Lys 
115 120 125 

Ser Lys Phe He Glu Ser 
13 0 



<210> 69 
<211> 21 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibimg der kiinstlichen Sequenz: 
oligonucleotide primer 

<400> 69 

cgtgaatacg gcgtggagtc g 21 

<210> 70 
<211> 20 
<212> DNA 

<213> Kttnstliche Sequenz 
<220> 

<223> Beschreibung der IcQnstlichen Sequenz: 
oligonucleotide primer 

<400> 70 

cggcaggata atcaggttgg 20 

<210> 71 
<211> 20 
<212> DNA 

<213> Ktlnstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz: 
oligonucleotide primer 



<400> 71 

gtcaacgtaa ccaaccctgc 



20 
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Box I Obseiratioxis vltere certain daims were fomid unsearchable (Continuation of item 1 of first sheet) 

This international searchieporthas not been established intespect of certain claimstinder Article 17(2)(a)forthe&llowingieasons: 
1. I I ClaimsNos.: 

> — * because Ihey relate to subject matter not required to be searched by this Authodty; namely: 



2. rj ClaimsNos.: 

because they relate to parts of the international application that do not comply with the piescribed requirements to such 
an exteaol that no meaningful international search can be canied out, specifically: 



3. ClaimsNos.: 

' — ' because they are dependent claims and are not drafted ia accordance with the second and third sentences of Rule 6.4(a). 



Box n Obsen^ations where unity of invention is lacking (Continuation of item 2 of first sheet) 



This hxtecnatianal Searching Authority found multiple inventions in this international apphcation, as follows: 
SEE SUPPLEMENTAL BOX 



1. I I As all required additional search fees were timely paid by the applicant, this international search report covers all 

searchable claims . 

2. I I As aU searchable claims couldbe searched without elBFortj^^ 

of any additional fee. 

3 . I I As only some of the required additional search fees were timely paid by ^e applicant, this international search report 
* — ' covers only those claims for which fees were paid, spedficaUy daims Nos.: 
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Inteniational explication No. 

EP03/07877 



TTie International Searching Authority has determined that this international 
application contains multiple (groups of) inventions, namely 

1. Claims 1-19 

method of preparing transformed plant cells and organisms, 
including the transformation of a population of ceUs that 
contain a negative marker protein, with a nucleic acid sequence 
that reduces the effect of the negative marker protein. 



2- Claims 20, 21 



amino acid and nucleic acid sequences coding for a plant 5- 
methyl-thioribose kinase. 



3. aaims 22-25 (in full), 28-31 (m part) 

double-stranded RNA molecule comprising sense and antisense 
strands of a marker protein as well as plants containing said 
molecule. 



4. Claims 26, 27 (in fuU), 28-31 (in part) 

expression cassette containing a marker protein in the antisense 
orientation as well as plants that contain said cassette. 
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B. RECHERCHIERTE GEBIETE 
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Recherchierte aber nlchl zum Mindestpriifstoff gehdrende VerSflentBchungen. soweil diese unter die recherchlerten Gebiete faDen 
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'* Besondere Kategorien von angegebenen Verdffentlichungen : 
'A' Ver5ffentlichung, die den allgemelnen Stand der Technik definierl. 
aber ntcht als besonders bedeutsam anzusehen 1st 

'E' filleres Dokument das ledoch erst am Oder nach dam intemationalen 
Anmeldedatum verdffentllcht worden ist 

'L' Ver&ffentlichung, die geeignet Ist. einen Priorttdtsanspruch zwelfelhafl er- 
scheinen zu lassen, oder durch die das VerOfTentUchungsdatum einer 
anderen Im Recherchenbericht genannten VerSffentllchung belegt werden 
soli Oder (fie aus einem anderen besonderen Grund angegeben ist (wie 
ausgefQhrt) 

"O* Veioffentlichung, die sich auf eine mOndOche Offenbarung, 

eine Benutzung. eine AussteDung oder andeie Mafinahmen bezleht 

'P' VerOffentlchung, cfie vor dam Intemationalen Anmeldedatum. aber nach 
dam beanspnichten Prioftt§tsdatum verSffentlicht worden Isl 



T* SpStere VerGffentlichung, die nach dem intemationalen Anmeldedatum 
Oder dem Prloritatsdalum verdffentOcht worden ist und mil der 
Anmeldung nicht kolBdiert, sondem nur zum Verslandnts des der 
Eifindung zugrundeliegenden PHnzlps oder der Ihr zugrundeDegenden 
Theorie angegeben Ist 

■X' Verdffentllchung von besonderer Bedeutung; die beanspruchte Erfindung 
kann allein au^rund dieser Veroffentllchung nteht als neu oder auf 
erfhiderischer Tdtigkelt beruhend betrachtet wenten 

*Y* VerSffentBchung von besonderer Bedeutung; die beanspruchte Erfindung 
kann nicht als auf erfindeilscherTatigkeit beruhend betrachtet 
werden, wenn die VerOffentOchung mtl einer oder mehteren anderen 
VerSfTentlichungen dieser Kategoria m Verbindung gabracht wlrd und 
diese Vert)indung fQr eInen Faohmann naheliegend 1st 

*&* VerSffentlichung. die MltgHed derselben PalentfamiUe ist 
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Intamationales Aktenz^chen 
PCT/EP 03/07877 



Feld I Bemerkunaen zu den AnsprOchen. die sich als nicht recherchietbar erwieaen haben (Fortsetzung von Punkt 2 auf Blatt 1) 



Gemas Artikel 17(2)a) wurde aus folgenden GrQnden «r bestimmte Anspruche kein Recherchenbericht ersteitt 
□ 

weH ste^Scha^ Gegenstande beziehen, zu deren Recherche die Behfirde rttht verpflichtet Isl, nSmBch 



^" ' wSfsKh^f Telle der intemationalen Anmeldung beziehen. die den vorgeschriebenen Anforderungen so wenig entsprechen, 
daB elne sinnvoHe Internationale Recherche nicht durchgefuhrt werden kann, namlich 



^" ^ ^fe"^ steh^dabei um abhangige Anspruche handelt. die nicht entsprechend Satz 2 and 3 der Regel 6.4 a) abgefaBt sind 



Feld II BemeiKungen bei mar^gelrKJer Bnheitlichkeit der Erfindung (Fortsetzung von Punkt 3 auf Blatt 1) 



Die Internationale RecherchenbehSrde hat festgesteilt. daB diese Internationale Anmeldung mehrere Eriindungen enthSll: 



s1ehe Zusatzblatt 



□ Da der Anmelder alle ertorderlichen zusatzlichen RecherchengebOhren rechtzeitig entrichtet hat. erstreckt sich dieser 
Internationale Recherchenbertoht auf aMe recherchlerbaren AnsprOche. 

□ Da tor alie recherchlerbaren Anspruche die Recherche ohne elnen Arbeitsaufwand durchgefQhrt werden konnte^^^ 
zusaaT^^^ gerechtfertigt hStte. hat die BehOrde nteht zur Z&hlung einer solchen Gebuhr aufgefordert 



I — I Da der Anmelder nur einiae der ertordeilichen zusStdlchen RecherchengebOhren rechtzeitig enWchtet hat. ersfreckt sich 
AnsprOche Nr. 



4. nn Der Anmelder hat die ertorderlichen zusatziichen RecherchengebOhren njcht jechbelt^^^^^ i^fLlSi?^1?^^ 
^ chenberlcht beschrfinkt steh daher auf die In den Anspruchen zuerst erwShnt© Erfindung; diese ist in fOlgenden Ansprucnen er 



fafBt: 
1-19 



Bemerkungen hinsichtlich eines Widwspnichs Q Die zusatzlichen Gebuhren wurden vom Anmelder unter WWerspmch gezahlt. 

[ [ Die ZaNung zusatzlicher RecherchengebOhren erfolgte ohne Wlderspmch. 
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WETTERE ANGABEN PCT/ISA/ 210 



Die Internationale Recherchenbehorde hat festgestellt, dass diese 
internationale Anmeldung mehrere (Gruppen von) Erflndungen enthalt, 
namlich: 

1. Anspruche: 1-19 

Verfahren zur Herstellung transformierter pflanzlicher 
Zellen und Organismen, beinhaltend die Tranformation einer 
Population von Zellen, welche eine negatives Markerprotei n 
enthalten, mit einer Nuklelnsauresequenz, welche die Wirkung 
des negativen Markerprotei ns reduziert 



2. Anspruche: 20, 21 

Aminosauren- und Nukleinsauresequenzen kodierend fur eine 
pf 1 anzl 1 Che 5-methyl -t hi or i boseki nase 



3. Anspruche: 22-25 (ganz), 28-31 (teilweise) 

Doppelstrangiges RNA-Molekul umfassend sense- und antisense- 
Strang eines Markerprotei ns, sowie Pflanzen, welche besagtes 
Molekul enthalten 



4. Anspruche: 26, 27 (ganz), 28-31 (teilweise) 

Expresslonskassette enthaltend ein Markerprotein in 
Antisense-Orientierung, sowie Pflanzen, welche besagte 
Kassette enthalten 
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